Palacios Public Git Repository

To checkout Palacios execute

  git clone http://v3vee.org/palacios/palacios.web/palacios.git
This will give you the master branch. You probably want the devel branch or one of the release branches. To switch to the devel branch, simply execute
  cd palacios
  git checkout --track -b devel origin/devel
The other branches are similar.


Better support for dynamic changes to page event callbacks
[palacios.git] / palacios / src / palacios / vmm_shadow_paging.c
index eeb4fda..9650f13 100644 (file)
+/* 
+ * This file is part of the Palacios Virtual Machine Monitor developed
+ * by the V3VEE Project with funding from the United States National 
+ * Science Foundation and the Department of Energy.  
+ *
+ * The V3VEE Project is a joint project between Northwestern University
+ * and the University of New Mexico.  You can find out more at 
+ * http://www.v3vee.org
+ *
+ * Copyright (c) 2008, Jack Lange <jarusl@cs.northwestern.edu> 
+ * Copyright (c) 2008, The V3VEE Project <http://www.v3vee.org> 
+ * All rights reserved.
+ *
+ * Author: Jack Lange <jarusl@cs.northwestern.edu>
+ *
+ * This is free software.  You are permitted to use,
+ * redistribute, and modify it as specified in the file "V3VEE_LICENSE".
+ */
+
+
 #include <palacios/vmm_shadow_paging.h>
 
 
 #include <palacios/vmm.h>
 #include <palacios/vm_guest_mem.h>
 #include <palacios/vmm_decoder.h>
+#include <palacios/vmm_ctrl_regs.h>
 
+#include <palacios/vmm_hashtable.h>
 
+#include <palacios/vmm_direct_paging.h>
 
-int init_shadow_page_state(struct shadow_page_state * state) {
-  state->guest_mode = PDE32;
-  state->shadow_mode = PDE32;
-  
-  state->guest_cr3 = 0;
-  state->shadow_cr3 = 0;
 
-  return 0;
-}
 
-int handle_shadow_pagefault(struct guest_info * info, addr_t fault_addr, pf_error_t error_code) {
-  
-  if (info->mem_mode == PHYSICAL_MEM) {
-    // If paging is not turned on we need to handle the special cases
-    return handle_special_page_fault(info, fault_addr, error_code);
-  } else if (info->mem_mode == VIRTUAL_MEM) {
-
-    switch (info->cpu_mode) {
-    case PROTECTED:
-      return handle_shadow_pagefault32(info, fault_addr, error_code);
-      break;
-    case PROTECTED_PAE:
-    case LONG:
-      // currently not handled
-      return -1;
-      break;
-    default:
-      return -1;
-    }
-  } else {
-    PrintDebug("Invalid Memory mode\n");
-    return -1;
-  }
-}
 
-addr_t create_new_shadow_pt32(struct guest_info * info) {
-  void * host_pde = 0;
+#ifdef V3_CONFIG_SHADOW_PAGING_TELEMETRY
+#include <palacios/vmm_telemetry.h>
+#endif
 
-  V3_AllocPages(host_pde, 1);
-  memset(host_pde, 0, PAGE_SIZE);
+#ifdef V3_CONFIG_SYMBIOTIC_SWAP
+#include <palacios/vmm_sym_swap.h>
+#endif
 
-  return (addr_t)host_pde;
-}
+#ifndef V3_CONFIG_DEBUG_SHADOW_PAGING
+#undef PrintDebug
+#define PrintDebug(fmt, args...)
+#endif
 
 
-static int handle_pd32_nonaligned_4MB_page(struct guest_info * info, pte32_t * pt, addr_t guest_addr, pde32_4MB_t * large_shadow_pde) {
-  uint_t i = 0;
-  pte32_t * pte_cursor;
-  addr_t guest_pa = 0;
+static const char default_strategy[] = "VTLB";
 
-  for (i = 0; i < 1024; i++) {
-    guest_pa = guest_addr + (PAGE_SIZE * i);
-    host_region_type_t host_page_type = get_shadow_addr_type(info, guest_pa);
-    
-    pte_cursor = &(pt[i]);
 
-    if (host_page_type == HOST_REGION_INVALID) {
-      // Currently we don't support this, but in theory we could
-      PrintDebug("Invalid Host Memory Type\n");
-      return -1;
-    } else if (host_page_type == HOST_REGION_PHYSICAL_MEMORY) {
-      addr_t shadow_pa = get_shadow_addr(info, guest_pa);
+static struct hashtable * master_shdw_pg_table = NULL;
 
 
-      pte_cursor->page_base_addr = PT32_BASE_ADDR(shadow_pa);
-      pte_cursor->present = 1;
-      pte_cursor->writable = large_shadow_pde->writable;
-      pte_cursor->user_page = large_shadow_pde->user_page;
-      pte_cursor->write_through = 0;  
-      pte_cursor->cache_disable = 0;
-      pte_cursor->global_page = 0;
+struct event_callback {
+    int (*callback)(struct guest_info *core, struct v3_shdw_pg_event *event, void *priv_data);
+    void *priv_data;
 
-    } else {
-      PrintDebug("Unsupported Host Memory Type\n");
-      return -1;
-    }
-  }
-  return 0;
+    struct list_head node;
+};
+
+static uint_t shdw_pg_hash_fn(addr_t key) {
+    char * name = (char *)key;
+    return v3_hash_buffer((uint8_t *)name, strlen(name));
 }
 
-int handle_shadow_pagefault32(struct guest_info * info, addr_t fault_addr, pf_error_t error_code) {
-  pde32_t * guest_pd = NULL;
-  pde32_t * shadow_pd = (pde32_t *)CR3_TO_PDE32(info->shdw_pg_state.shadow_cr3);
-  addr_t guest_cr3 = CR3_TO_PDE32(info->shdw_pg_state.guest_cr3);
-  pt_access_status_t guest_pde_access;
-  pt_access_status_t shadow_pde_access;
-  pde32_t * guest_pde = NULL;
-  pde32_t * shadow_pde = (pde32_t *)&(shadow_pd[PDE32_INDEX(fault_addr)]);
-
-  if (guest_pa_to_host_va(info, guest_cr3, (addr_t*)&guest_pd) == -1) {
-    PrintDebug("Invalid Guest PDE Address: 0x%x\n", guest_cr3);
-    return -1;
-  }
+static int shdw_pg_eq_fn(addr_t key1, addr_t key2) {
+    char * name1 = (char *)key1;
+    char * name2 = (char *)key2;
 
+    return (strcmp(name1, name2) == 0);
+}
 
-  guest_pde = (pde32_t *)&(guest_pd[PDE32_INDEX(fault_addr)]);
+static int have_callbacks(struct guest_info *core)
+{
+    // lock acquistion unnecessary
+    // caller will acquire the lock before *iterating* through the list
+    // so any race will be resolved then
+    return !list_empty(&(core->vm_info->shdw_impl.event_callback_list));
+}
 
-  // Check the guest page permissions
-  guest_pde_access = can_access_pde32(guest_pd, fault_addr, error_code);
+static void dispatch_event(struct guest_info *core, struct v3_shdw_pg_event *event)
+{
+    struct event_callback *cb,*temp;
 
-  // Check the shadow page permissions
-  shadow_pde_access = can_access_pde32(shadow_pd, fault_addr, error_code);
-  
-  /* This should be redone, 
-     but basically the reasoning is that there can be multiple reasons for a page fault:
-     If there is a permissions failure for a page present in the guest _BUT_ 
-     the reason for the fault was that the page is not present in the shadow, 
-     _THEN_ we have to map the shadow page in and reexecute, this will generate 
-     a permissions fault which is _THEN_ valid to send to the guest
+    v3_read_lock(&(core->vm_info->shdw_impl.event_callback_lock));
 
-     whew...
-  */
-  if ((guest_pde_access != PT_ACCESS_OK) &&
-      ( (shadow_pde_access != PT_ENTRY_NOT_PRESENT) &&
-       (guest_pde_access != PT_ENTRY_NOT_PRESENT))) { // aka (guest permission error)
-    // inject page fault to the guest (Guest PDE fault)
+    list_for_each_entry_safe(cb,
+                            temp,
+                            &(core->vm_info->shdw_impl.event_callback_list),
+                            node) {
+       cb->callback(core,event,cb->priv_data);
+    }
 
-       info->ctrl_regs.cr2 = fault_addr;
-    raise_exception_with_error(info, PF_EXCEPTION, *(uint_t *)&error_code);
+    v3_read_unlock(&(core->vm_info->shdw_impl.event_callback_lock));
+}
 
 
-    PrintDebug("Injecting PDE pf to guest: (guest access error=%d) (pf error code=%d)\n", guest_pde_access, error_code);
-    return 0;
+int V3_init_shdw_paging() {
+    extern struct v3_shdw_pg_impl * __start__v3_shdw_pg_impls[];
+    extern struct v3_shdw_pg_impl * __stop__v3_shdw_pg_impls[];
+    struct v3_shdw_pg_impl ** tmp_impl = __start__v3_shdw_pg_impls;
+    int i = 0;
 
-    PrintDebug("Guest CR3=%x\n", guest_cr3);
-    PrintDebug("Guest PD\n");
-    PrintPD32(guest_pd);
-    PrintDebug("Shadow PD\n");
-    PrintPD32(shadow_pd);
+    master_shdw_pg_table = v3_create_htable(0, shdw_pg_hash_fn, shdw_pg_eq_fn);
 
 
-    return -1;
-  }
+    while (tmp_impl != __stop__v3_shdw_pg_impls) {
+       V3_Print(VM_NONE, VCORE_NONE, "Registering Shadow Paging Impl (%s)\n", (*tmp_impl)->name);
 
+       if (v3_htable_search(master_shdw_pg_table, (addr_t)((*tmp_impl)->name))) {
+           PrintError(VM_NONE, VCORE_NONE, "Multiple instances of shadow paging impl (%s)\n", (*tmp_impl)->name);
+           return -1;
+       }
 
-  //shadow_pde_access = can_access_pde32(shadow_pd, fault_addr, error_code);
+       if (v3_htable_insert(master_shdw_pg_table, 
+                            (addr_t)((*tmp_impl)->name),
+                            (addr_t)(*tmp_impl)) == 0) {
+           PrintError(VM_NONE, VCORE_NONE, "Could not register shadow paging impl (%s)\n", (*tmp_impl)->name);
+           return -1;
+       }
 
+       tmp_impl = &(__start__v3_shdw_pg_impls[++i]);
+    }
 
-  if (shadow_pde_access == PT_ENTRY_NOT_PRESENT) {
+    return 0;
+}
 
-    shadow_pde->present = 1;
-    shadow_pde->user_page = guest_pde->user_page;
-    shadow_pde->large_page = guest_pde->large_page;
+int V3_deinit_shdw_paging() {
+    v3_free_htable(master_shdw_pg_table, 0, 0);
+    return 0;
+}
 
 
-    // VMM Specific options
-    shadow_pde->write_through = 0;
-    shadow_pde->cache_disable = 0;
-    shadow_pde->global_page = 0;
-    //
 
-    guest_pde->accessed = 1;
-    
-    if (guest_pde->large_page == 0) {
-      pte32_t * shadow_pt = NULL;
-      
-      V3_AllocPages(shadow_pt, 1);
-      memset(shadow_pt, 0, PAGE_SIZE);
-      
-      shadow_pde->pt_base_addr = PD32_BASE_ADDR(shadow_pt);
-
-      shadow_pde->writable = guest_pde->writable;
-    } else {
-      struct shadow_region * mem_reg;
-      pde32_4MB_t * large_guest_pde = (pde32_4MB_t *)guest_pde;
-      pde32_4MB_t * large_shadow_pde = (pde32_4MB_t *)shadow_pde;
-      host_region_type_t host_page_type;
-      addr_t guest_start_addr = PDE32_4MB_T_ADDR(*large_guest_pde);
-      //    addr_t guest_end_addr = guest_start_addr + PAGE_SIZE_4MB; // start address + 4MB
+/*** 
+ ***  There be dragons
+ ***/
 
 
-      // Check that the Guest PDE entry points to valid memory
-      // else Machine Check the guest
-      PrintDebug("Large Page: Page Base Addr=%x\n", guest_start_addr);
+#ifdef V3_CONFIG_SHADOW_PAGING_TELEMETRY
+static void telemetry_cb(struct v3_vm_info * vm, void * private_data, char * hdr) {
+    int i = 0;
+    for (i = 0; i < vm->num_cores; i++) {
+       struct guest_info * core = &(vm->cores[i]);
 
-      host_page_type = get_shadow_addr_type(info, guest_start_addr);
+       V3_Print(vm, core, "%s Guest Page faults: %d\n", hdr, core->shdw_pg_state.guest_faults);
+    }
+}
+#endif
 
-      if (host_page_type == HOST_REGION_INVALID) {
 
-       raise_exception(info, MC_EXCEPTION);
-       PrintDebug("Invalid guest address in large page (0x%x)\n", guest_start_addr);
-       return -1;
-      } else if (host_page_type == HOST_REGION_PHYSICAL_MEMORY) {
-       addr_t host_start_addr = 0;
-       addr_t region_end_addr = 0;
 
-       // Check for a large enough region in host memory
-       mem_reg = get_shadow_region_by_addr(&(info->mem_map), guest_start_addr);
-       PrintDebug("Host region: host_addr=%x (guest_start=%x, end=%x)\n", 
-                  mem_reg->host_addr, mem_reg->guest_start, mem_reg->guest_end);
-       host_start_addr = mem_reg->host_addr + (guest_start_addr - mem_reg->guest_start);
-       region_end_addr = mem_reg->host_addr + (mem_reg->guest_end - mem_reg->guest_start);
+int v3_init_shdw_pg_state(struct guest_info * core) {
+    struct v3_shdw_pg_state * state = &(core->shdw_pg_state);
+    struct v3_shdw_pg_impl * impl = core->vm_info->shdw_impl.current_impl;
+  
 
-       PrintDebug("Host Start Addr=%x; Region End Addr=%x\n", host_start_addr, region_end_addr);
+    state->guest_cr3 = 0;
+    state->guest_cr0 = 0;
+    state->guest_efer.value = 0x0LL;
 
+    if (impl->local_init(core) == -1) {
+       PrintError(core->vm_info, core, "Error in Shadow paging local initialization (%s)\n", impl->name);
+       return -1;
+    }
 
 
+#ifdef V3_CONFIG_SHADOW_PAGING_TELEMETRY
+    v3_add_telemetry_cb(core->vm_info, telemetry_cb, NULL);
+#endif
+  
 
-       //4f
-       if (large_guest_pde->dirty == 1) { // dirty
-         large_shadow_pde->writable = guest_pde->writable;
-       } else if (error_code.write == 1) { // not dirty, access is write
-         large_shadow_pde->writable = guest_pde->writable;
-         large_guest_pde->dirty = 1;
-       } else { // not dirty, access is read
-         large_shadow_pde->writable = 0;
-       }
+    return 0;
+}
 
 
-       // Check if the region is at least an additional 4MB
+int v3_deinit_shdw_pg_state(struct guest_info * core) {
+    struct v3_shdw_pg_impl * impl = NULL;
 
+    if (!core || !core->vm_info) {
+        return -1;
+    }
 
-       //4b.
-       if ((PD32_4MB_PAGE_OFFSET(host_start_addr) == 0) && 
-           (region_end_addr >= host_start_addr + PAGE_SIZE_4MB)) {     // if 4MB boundary
-         large_shadow_pde->page_base_addr = PD32_4MB_BASE_ADDR(host_start_addr);
-       } else {          // else generate 4k pages
-         pte32_t * shadow_pt = NULL;
-         PrintDebug("Handling non aligned large page\n");
+    impl = core->vm_info->shdw_impl.current_impl;
 
-         shadow_pde->large_page = 0;
-      
-         V3_AllocPages(shadow_pt, 1);
-         memset(shadow_pt, 0, PAGE_SIZE);
+    if (impl && impl->local_deinit(core) == -1) {
+       PrintError(core->vm_info, core, "Error deinitializing shadow paging state\n");
+       return -1;
+    }
 
-         if (handle_pd32_nonaligned_4MB_page(info, shadow_pt, guest_start_addr, large_shadow_pde) == -1) {
-           PrintDebug("Non Aligned Large Page Error\n");
-           V3_Free(shadow_pt);
-           return -1;
-         }
 
+    return 0;
+}
 
-         /*
-           PrintDebug("non-aligned Shadow PT\n");
-           PrintPT32(PT32_PAGE_ADDR(fault_addr), shadow_pt);     
-         */
-         shadow_pde->pt_base_addr = PD32_BASE_ADDR(shadow_pt);
-       }
 
-       
-      } else {
-       // Handle hooked pages as well as other special pages
-       if (handle_special_page_fault(info, fault_addr, error_code) == -1) {
-         PrintDebug("Special Page Fault handler returned error for address: %x\n", fault_addr);
-         return -1;
+
+int v3_init_shdw_impl(struct v3_vm_info * vm) {
+    struct v3_shdw_impl_state * impl_state = &(vm->shdw_impl);
+    v3_cfg_tree_t * pg_cfg = v3_cfg_subtree(vm->cfg_data->cfg, "paging");
+    char * pg_mode = v3_cfg_val(pg_cfg, "mode");
+    char * pg_strat = v3_cfg_val(pg_cfg, "strategy");
+    struct v3_shdw_pg_impl * impl = NULL;
+   
+    PrintDebug(vm, VCORE_NONE, "Checking if shadow paging requested.\n");
+    if (pg_mode == NULL) { 
+       V3_Print(vm, VCORE_NONE, "No paging mode specified, assuming shadow with defaults\n");
+       pg_mode = "shadow";
+    } else {
+       if (strcasecmp(pg_mode, "nested") == 0) {
+           // this check is repeated here (compare to vmm_config's determine paging mode) since
+           // shadow paging initialization *precedes* per-core pre-config.
+           extern v3_cpu_arch_t v3_mach_type;
+           if ((v3_mach_type == V3_SVM_REV3_CPU) || 
+               (v3_mach_type == V3_VMX_EPT_CPU) ||
+               (v3_mach_type == V3_VMX_EPT_UG_CPU)) {
+               PrintDebug(vm, VCORE_NONE, "Nested paging specified on machine that supports it - not initializing shadow paging\n");
+               return 0;
+           } else {
+               V3_Print(vm, VCORE_NONE, "Nested paging specified but machine does not support it - falling back to shadow paging with defaults\n");
+               pg_mode = "shadow";
+           }
+       } else if (strcasecmp(pg_mode, "shadow") != 0) { 
+           V3_Print(vm, VCORE_NONE, "Unknown paging mode '%s' specified - falling back to shadow paging with defaults\n",pg_mode);
+           pg_mode = "shadow";
        }
-      }
     }
 
-  } else if ((shadow_pde_access == PT_WRITE_ERROR) && 
-            (guest_pde->large_page = 1) && 
-            (((pde32_4MB_t *)guest_pde)->dirty == 0)) {
-
-    //
-    // Page Directory Entry marked read-only
-    //
-
-    ((pde32_4MB_t *)guest_pde)->dirty = 1;
-    shadow_pde->writable = guest_pde->writable;
-    return 0;
-
-  } else if (shadow_pde_access == PT_USER_ERROR) {
-
-    //
-    // Page Directory Entry marked non-user
-    //
-    
-    PrintDebug("Shadow Paging User access error\n");
-    return -1;
-  } else if (shadow_pde_access == PT_ACCESS_OK) {
-    pte32_t * shadow_pt = (pte32_t *)PDE32_T_ADDR((*shadow_pde));
-    pte32_t * guest_pt = NULL;
+    if (pg_strat == NULL) {
+       pg_strat = (char *)default_strategy;
+    }
+       
+    V3_Print(vm, VCORE_NONE,"Initialization of Shadow Paging implementation\n");
 
-    // Page Table Entry fault
-    
-    if (guest_pa_to_host_va(info, PDE32_T_ADDR((*guest_pde)), (addr_t*)&guest_pt) == -1) {
-      PrintDebug("Invalid Guest PTE Address: 0x%x\n", PDE32_T_ADDR((*guest_pde)));
-      // Machine check the guest
+    impl = (struct v3_shdw_pg_impl *)v3_htable_search(master_shdw_pg_table, (addr_t)pg_strat);
 
-      raise_exception(info, MC_EXCEPTION);
-      
-      return 0;
+    if (impl == NULL) {
+       PrintError(vm, VCORE_NONE, "Could not find shadow paging impl (%s)\n", pg_strat);
+       return -1;
     }
 
+    INIT_LIST_HEAD(&(impl_state->event_callback_list));
+    v3_rw_lock_init(&(impl_state->event_callback_lock));
+   
+    impl_state->current_impl = impl;
 
-    if (handle_shadow_pte32_fault(info, fault_addr, error_code, shadow_pt, guest_pt)  == -1) {
-      PrintDebug("Error handling Page fault caused by PTE\n");
-      return -1;
+    if (impl->init(vm, pg_cfg) == -1) {
+       PrintError(vm, VCORE_NONE, "Could not initialize Shadow paging implemenation (%s)\n", impl->name);
+       return -1;
     }
 
- } else {
-    // Unknown error raise page fault in guest
-    info->ctrl_regs.cr2 = fault_addr;
-    raise_exception_with_error(info, PF_EXCEPTION, *(uint_t *)&error_code);
 
-    // For debugging we will return an error here for the time being, 
-    // this probably shouldn't ever happen
-    PrintDebug("Unknown Error occurred\n");
-    PrintDebug("Manual Says to inject page fault into guest\n");
-    return -1;
-  }
 
-  //PrintDebugPageTables(shadow_pd);
-  PrintDebug("Returning end of PDE function (rip=%x)\n", info->rip);
-  return 0;
+    return 0;
 }
 
+int v3_deinit_shdw_impl(struct v3_vm_info * vm) {
+    struct v3_shdw_pg_impl * impl = vm->shdw_impl.current_impl;
+    struct event_callback *cb,*temp;
+    addr_t flags;
 
+    if (impl == NULL) {
+       // Shadow paging not implemented
+       return 0;
+    }
 
-/* 
- * We assume the the guest pte pointer has already been translated to a host virtual address
- */
-int handle_shadow_pte32_fault(struct guest_info * info, 
-                             addr_t fault_addr, 
-                             pf_error_t error_code,
-                             pte32_t * shadow_pt, 
-                             pte32_t * guest_pt) {
-
-  pt_access_status_t guest_pte_access;
-  pt_access_status_t shadow_pte_access;
-  pte32_t * guest_pte = (pte32_t *)&(guest_pt[PTE32_INDEX(fault_addr)]);;
-  pte32_t * shadow_pte = (pte32_t *)&(shadow_pt[PTE32_INDEX(fault_addr)]);
+    if (impl->deinit(vm) == -1) {
+       PrintError(vm, VCORE_NONE,"Error deinitializing shadow paging implementation\n");
+       return -1;
+    }
 
+    flags=v3_write_lock_irqsave(&(vm->shdw_impl.event_callback_lock));
 
-  // Check the guest page permissions
-  guest_pte_access = can_access_pte32(guest_pt, fault_addr, error_code);
+    list_for_each_entry_safe(cb,
+                            temp,
+                            &(vm->shdw_impl.event_callback_list),
+                            node) {
+       list_del(&(cb->node));
+       V3_Free(cb);
+    }
 
-  // Check the shadow page permissions
-  shadow_pte_access = can_access_pte32(shadow_pt, fault_addr, error_code);
-  
-  /* This should be redone, 
-     but basically the reasoning is that there can be multiple reasons for a page fault:
-     If there is a permissions failure for a page present in the guest _BUT_ 
-     the reason for the fault was that the page is not present in the shadow, 
-     _THEN_ we have to map the shadow page in and reexecute, this will generate 
-     a permissions fault which is _THEN_ valid to send to the guest
-
-     whew...
-  */
-  if ((guest_pte_access != PT_ACCESS_OK) && 
-      ((shadow_pte_access != PT_ENTRY_NOT_PRESENT) &&
-       (guest_pte_access != PT_ENTRY_NOT_PRESENT))) { // aka (guest permission error)
-    // Inject page fault into the guest        
-    
-    info->ctrl_regs.cr2 = fault_addr;
-    raise_exception_with_error(info, PF_EXCEPTION, *(uint_t *)&error_code);
-    
-    PrintDebug("Access error injecting pf to guest (guest access error=%d) (pf error code=%d)\n", guest_pte_access, error_code);
-    return 0; 
-  }
-  
-  
+    v3_write_unlock_irqrestore(&(vm->shdw_impl.event_callback_lock),flags);
 
+    v3_rw_lock_deinit(&(vm->shdw_impl.event_callback_lock));
 
-  if (shadow_pte_access == PT_ACCESS_OK) {
-    // Inconsistent state...
-    // Guest Re-Entry will flush page tables and everything should now work
-    PrintDebug("Inconsistent state... Guest re-entry should flush tlb\n");
     return 0;
-  } else if (shadow_pte_access == PT_ENTRY_NOT_PRESENT) {
-    addr_t shadow_pa;
-    addr_t guest_pa = PTE32_T_ADDR((*guest_pte));
-
-    // Page Table Entry Not Present
-
-    host_region_type_t host_page_type = get_shadow_addr_type(info, guest_pa);
-
-    if (host_page_type == HOST_REGION_INVALID) {
-      // Inject a machine check in the guest
-
-      raise_exception(info, MC_EXCEPTION);
-
-      PrintDebug("Invalid Guest Address in page table (0x%x)\n", guest_pa);
-      PrintDebug("fault_addr=0x%x next are guest and shadow ptes \n",fault_addr);
-      PrintPTE32(fault_addr,guest_pte);
-      PrintPTE32(fault_addr,shadow_pte);
-      PrintDebug("Done.\n");
-      return 0;
-
-    } else if (host_page_type == HOST_REGION_PHYSICAL_MEMORY) {
-      
-      shadow_pa = get_shadow_addr(info, guest_pa);
-      
-      shadow_pte->page_base_addr = PT32_BASE_ADDR(shadow_pa);
-      
-      shadow_pte->present = guest_pte->present;
-      shadow_pte->user_page = guest_pte->user_page;
-      
-      //set according to VMM policy
-      shadow_pte->write_through = 0;
-      shadow_pte->cache_disable = 0;
-      shadow_pte->global_page = 0;
-      //
-      
-      guest_pte->accessed = 1;
-      
-      if (guest_pte->dirty == 1) {
-       shadow_pte->writable = guest_pte->writable;
-      } else if ((guest_pte->dirty == 0) && (error_code.write == 1)) {
-       shadow_pte->writable = guest_pte->writable;
-       guest_pte->dirty = 1;
-      } else if ((guest_pte->dirty = 0) && (error_code.write == 0)) {
-       shadow_pte->writable = 0;
-      }
-    } else {
-      // Page fault handled by hook functions
-      if (handle_special_page_fault(info, fault_addr, error_code) == -1) {
-       PrintDebug("Special Page fault handler returned error for address: %x\n", fault_addr);
-       return -1;
-      }
-    }
-
-  } else if ((shadow_pte_access == PT_WRITE_ERROR) &&
-            (guest_pte->dirty == 0)) {
-    guest_pte->dirty = 1;
-    shadow_pte->writable = guest_pte->writable;
+}
 
-    PrintDebug("Shadow PTE Write Error\n");
 
-    return 0;
-  } else {
-    // Inject page fault into the guest        
+// Reads the guest CR3 register
+// creates new shadow page tables
+// updates the shadow CR3 register to point to the new pts
+int v3_activate_shadow_pt(struct guest_info * core) {
+    struct v3_shdw_impl_state * state = &(core->vm_info->shdw_impl);
+    struct v3_shdw_pg_impl * impl = state->current_impl;
+    
+    if (!have_callbacks(core)) { 
+       return impl->activate_shdw_pt(core);
+    } else {
+       int rc;
+       struct v3_shdw_pg_event event_pre={SHADOW_ACTIVATE,SHADOW_PREIMPL,0,{0,0,0,0,0,0}};
+       struct v3_shdw_pg_event event_post={SHADOW_ACTIVATE,SHADOW_POSTIMPL,0,{0,0,0,0,0,0}};
        
-    info->ctrl_regs.cr2 = fault_addr;
-    raise_exception_with_error(info, PF_EXCEPTION, *(uint_t *)&error_code);
+       dispatch_event(core,&event_pre);
 
-    PrintDebug("PTE Page fault fell through... Not sure if this should ever happen\n");
-    PrintDebug("Manual Says to inject page fault into guest\n");
-    return -1;
-  }
+       rc =impl->activate_shdw_pt(core);
 
-  PrintDebug("Returning end of function\n");
-  return 0;
+       dispatch_event(core,&event_post);
+       
+       return rc;
+    }
 }
 
 
 
+// This must flush any caches
+// and reset the cr3 value to the correct value
+int v3_invalidate_shadow_pts(struct guest_info * core) {
+    struct v3_shdw_impl_state * state = &(core->vm_info->shdw_impl);
+    struct v3_shdw_pg_impl * impl = state->current_impl;
 
+    if (!have_callbacks(core)) { 
+       return impl->invalidate_shdw_pt(core);
+    } else {
+       int rc;
+       struct v3_shdw_pg_event event_pre={SHADOW_INVALIDATE,SHADOW_PREIMPL,0,{0,0,0,0,0,0}};
+       struct v3_shdw_pg_event event_post={SHADOW_INVALIDATE,SHADOW_POSTIMPL,0,{0,0,0,0,0,0}};
+       
+       dispatch_event(core,&event_pre);
 
+       rc = impl->invalidate_shdw_pt(core);
 
-/* Currently Does not work with Segmentation!!! */
-int handle_shadow_invlpg(struct guest_info * info) {
-  if (info->mem_mode != VIRTUAL_MEM) {
-    // Paging must be turned on...
-    // should handle with some sort of fault I think
-    PrintDebug("ERROR: INVLPG called in non paged mode\n");
-    return -1;
-  }
+       dispatch_event(core,&event_post);
+       
+       return rc;
+    }
+}
 
 
-  if (info->cpu_mode == PROTECTED) {
-    char instr[15];
-    int ret;
-    int index = 0;
+int v3_handle_shadow_pagefault(struct guest_info * core, addr_t fault_addr, pf_error_t error_code) 
+{
+    int rc;
+   
 
-    ret = read_guest_va_memory(info, get_addr_linear(info, info->rip, &(info->segments.cs)), 15, instr);
-    if (ret != 15) {
-      PrintDebug("Could not read instruction 0x%x (ret=%d)\n", info->rip, ret);
-      return -1;
+    if (have_callbacks(core)) { 
+       struct v3_shdw_pg_event event={SHADOW_PAGEFAULT,SHADOW_PREIMPL,fault_addr,error_code};
+       dispatch_event(core,&event);
     }
-
-   
-    /* Can INVLPG work with Segments?? */
-    while (is_prefix_byte(instr[index])) {
-      index++;
+    
+    if (v3_get_vm_mem_mode(core) == PHYSICAL_MEM) {
+       // If paging is not turned on we need to handle the special cases
+      rc = v3_handle_passthrough_pagefault(core, fault_addr, error_code,NULL,NULL);
+    } else if (v3_get_vm_mem_mode(core) == VIRTUAL_MEM) {
+       struct v3_shdw_impl_state * state = &(core->vm_info->shdw_impl);
+       struct v3_shdw_pg_impl * impl = state->current_impl;
+       
+       rc = impl->handle_pagefault(core, fault_addr, error_code);
+    } else {
+       PrintError(core->vm_info, core, "Invalid Memory mode\n");
+       rc = -1;
     }
     
+    if (have_callbacks(core)) {
+       struct v3_shdw_pg_event event={SHADOW_PAGEFAULT,SHADOW_POSTIMPL,fault_addr,error_code};
+       dispatch_event(core,&event);
+    }
     
-    if ((instr[index] == (uchar_t)0x0f) &&
-       (instr[index + 1] == (uchar_t)0x01)) {
+    return rc;
+}
 
-      addr_t first_operand;
-      addr_t second_operand;
-      operand_type_t addr_type;
-      addr_t guest_cr3 = CR3_TO_PDE32(info->shdw_pg_state.guest_cr3);
 
-      pde32_t * guest_pd = NULL;
+int v3_handle_shadow_invlpg(struct guest_info * core) {
+    uchar_t instr[15];
+    struct x86_instr dec_instr;
+    int ret = 0;
+    addr_t vaddr = 0;
 
-      if (guest_pa_to_host_va(info, guest_cr3, (addr_t*)&guest_pd) == -1) {
-       PrintDebug("Invalid Guest PDE Address: 0x%x\n", guest_cr3);
+    if (v3_get_vm_mem_mode(core) != VIRTUAL_MEM) {
+       // Paging must be turned on...
+       // should handle with some sort of fault I think
+       PrintError(core->vm_info, core, "ERROR: INVLPG called in non paged mode\n");
        return -1;
-      }
+    }
 
-      
+    if (v3_get_vm_mem_mode(core) == PHYSICAL_MEM) { 
+       ret = v3_read_gpa_memory(core, get_addr_linear(core, core->rip, &(core->segments.cs)), 15, instr);
+    } else { 
+       ret = v3_read_gva_memory(core, get_addr_linear(core, core->rip, &(core->segments.cs)), 15, instr);
+    }
 
+    if (ret == -1) {
+       PrintError(core->vm_info, core, "Could not read instruction into buffer\n");
+       return -1;
+    }
 
-      index += 2;
+    if (v3_decode(core, (addr_t)instr, &dec_instr) == -1) {
+       PrintError(core->vm_info, core, "Decoding Error\n");
+       return -1;
+    }
+  
+    if ((dec_instr.op_type != V3_OP_INVLPG) || 
+       (dec_instr.num_operands != 1) ||
+       (dec_instr.dst_operand.type != MEM_OPERAND)) {
+       PrintError(core->vm_info, core, "Decoder Error: Not a valid INVLPG instruction...\n");
+       return -1;
+    }
 
-      addr_type = decode_operands32(&(info->vm_regs), instr + index, &index, &first_operand, &second_operand, REG32);
+    vaddr = dec_instr.dst_operand.operand;
 
-      if (addr_type == MEM_OPERAND) {
-       pde32_t * shadow_pd = (pde32_t *)CR3_TO_PDE32(info->shdw_pg_state.shadow_cr3);
-       pde32_t * shadow_pde = (pde32_t *)&shadow_pd[PDE32_INDEX(first_operand)];
-       pde32_t * guest_pde;
+    core->rip += dec_instr.instr_length;
 
-       //PrintDebug("PDE Index=%d\n", PDE32_INDEX(first_operand));
-       //PrintDebug("FirstOperand = %x\n", first_operand);
+    {
+       struct v3_shdw_impl_state * state = &(core->vm_info->shdw_impl);
+       struct v3_shdw_pg_impl * impl = state->current_impl;
+       int rc;
 
-       PrintDebug("Invalidating page for %x\n", first_operand);
+       if (have_callbacks(core)) { 
+           struct v3_shdw_pg_event event={SHADOW_INVLPG,SHADOW_PREIMPL,vaddr,{0,0,0,0,0,0}};
+           dispatch_event(core,&event);
+       }
 
-       guest_pde = (pde32_t *)&(guest_pd[PDE32_INDEX(first_operand)]);
+       rc=impl->handle_invlpg(core, vaddr);
 
-       if (guest_pde->large_page == 1) {
-         shadow_pde->present = 0;
-         PrintDebug("Invalidating Large Page\n");
-       } else {
-        
-         if (shadow_pde->present == 1) {
-           pte32_t * shadow_pt = (pte32_t *)PDE32_T_ADDR((*shadow_pde));
-           pte32_t * shadow_pte = (pte32_t *)&shadow_pt[PTE32_INDEX(first_operand)];
-           PrintDebug("Setting not present\n");
-           PrintPTE32(first_operand, shadow_pte);
-           shadow_pte->present = 0;
-         }
+       if (have_callbacks(core)) { 
+           struct v3_shdw_pg_event event={SHADOW_INVLPG,SHADOW_POSTIMPL,vaddr,{0,0,0,0,0,0}};
+           dispatch_event(core,&event);
        }
 
-       info->rip += index;
-
-      } else {
-       PrintDebug("Invalid Operand type\n");
-       return -1;
-      }
-    } else {
-      PrintDebug("invalid Instruction Opcode\n");
-      PrintTraceMemDump(instr, 15);
-      return -1;
+       return rc;
     }
-  }
-
-  return 0;
 }
 
 
 
-/* Deprecated */
-/*
-addr_t setup_shadow_pt32(struct guest_info * info, addr_t virt_cr3) {
-  addr_t cr3_guest_addr = CR3_TO_PDE32(virt_cr3);
-  pde32_t * guest_pde;
-  pde32_t * host_pde = NULL;
-  int i;
-  
-  // Setup up guest_pde to point to the PageDir in host addr
-  if (guest_pa_to_host_va(info, cr3_guest_addr, (addr_t*)&guest_pde) == -1) {
-    return 0;
-  }
-  
-  V3_AllocPages(host_pde, 1);
-  memset(host_pde, 0, PAGE_SIZE);
 
-  for (i = 0; i < MAX_PDE32_ENTRIES; i++) {
-    if (guest_pde[i].present == 1) {
-      addr_t pt_host_addr;
-      addr_t host_pte;
 
-      if (guest_pa_to_host_va(info, PDE32_T_ADDR(guest_pde[i]), &pt_host_addr) == -1) {
-       return 0;
-      }
 
-      if ((host_pte = setup_shadow_pte32(info, pt_host_addr)) == 0) {
-       return 0;
-      }
+int v3_inject_guest_pf(struct guest_info * core, addr_t fault_addr, pf_error_t error_code) {
+    core->ctrl_regs.cr2 = fault_addr;
 
-      host_pde[i].present = 1;
-      host_pde[i].pt_base_addr = PD32_BASE_ADDR(host_pte);
+#ifdef V3_CONFIG_SHADOW_PAGING_TELEMETRY
+    core->shdw_pg_state.guest_faults++;
+#endif
 
-      //
-      // Set Page DIR flags
-      //
-    }
-  }
+    return v3_raise_exception_with_error(core, PF_EXCEPTION, *(uint_t *)&error_code);
+}
 
-  PrintDebugPageTables(host_pde);
 
-  return (addr_t)host_pde;
-}
+int v3_is_guest_pf(pt_access_status_t guest_access, pt_access_status_t shadow_access) {
+    /* basically the reasoning is that there can be multiple reasons for a page fault:
+       If there is a permissions failure for a page present in the guest _BUT_
+       the reason for the fault was that the page is not present in the shadow,
+       _THEN_ we have to map the shadow page in and reexecute, this will generate
+       a permissions fault which is _THEN_ valid to send to the guest
+       _UNLESS_ both the guest and shadow have marked the page as not present
+
+       whew...
+    */
+    if (guest_access != PT_ACCESS_OK) {
+       // Guest Access Error
+
+       if ((shadow_access != PT_ACCESS_NOT_PRESENT) &&
+           (guest_access != PT_ACCESS_NOT_PRESENT)) {
+           // aka (guest permission error)
+           return 1;
+       }
 
+       /*
+         if ((shadow_access == PT_ACCESS_NOT_PRESENT) &&
+         (guest_access == PT_ACCESS_NOT_PRESENT)) {
+         // Page tables completely blank, handle guest first
+         return 1;
+         }
+       */
 
+       if (guest_access == PT_ACCESS_NOT_PRESENT) {
+           // Page tables completely blank, handle guest first
+           return 1;
+       }
+       
+       // Otherwise we'll handle the guest fault later...?
+    }
 
-addr_t setup_shadow_pte32(struct guest_info * info, addr_t pt_host_addr) {
-  pte32_t * guest_pte = (pte32_t *)pt_host_addr;
-  pte32_t * host_pte = NULL;
-  int i;
+    return 0;
+}
 
-  V3_AllocPages(host_pte, 1);
-  memset(host_pte, 0, PAGE_SIZE);
 
-  for (i = 0; i < MAX_PTE32_ENTRIES; i++) {
-    if (guest_pte[i].present == 1) {
-      addr_t guest_pa = PTE32_T_ADDR(guest_pte[i]);
-      shadow_mem_type_t page_type;
-      addr_t host_pa = 0;
+int v3_register_shadow_paging_event_callback(struct v3_vm_info *vm,
+                                            int (*callback)(struct guest_info *core, 
+                                                            struct v3_shdw_pg_event *event,
+                                                            void      *priv_data),
+                                            void *priv_data)
+{
+    struct event_callback *ec = V3_Malloc(sizeof(struct event_callback));
+    addr_t flags;
 
-      page_type = get_shadow_addr_type(info, guest_pa);
+    if (!ec) { 
+       PrintError(vm, VCORE_NONE, "Unable to allocate for a shadow paging event callback\n");
+       return -1;
+    }
+    
+    ec->callback = callback;
+    ec->priv_data = priv_data;
 
-      if (page_type == HOST_REGION_PHYSICAL_MEMORY) {
-       host_pa = get_shadow_addr(info, guest_pa);
-      } else {
-       
-       //
-       // Setup various memory types
-       //
-      }
+    flags=v3_write_lock_irqsave(&(vm->shdw_impl.event_callback_lock));
+    list_add(&(ec->node),&(vm->shdw_impl.event_callback_list));
+    v3_write_unlock_irqrestore(&(vm->shdw_impl.event_callback_lock),flags);
 
-      host_pte[i].page_base_addr = PT32_BASE_ADDR(host_pa);
-      host_pte[i].present = 1;
+    return 0;
+
+}
+
+int v3_unregister_shadow_paging_event_callback(struct v3_vm_info *vm,
+                                              int (*callback)(struct guest_info *core, 
+                                                              struct v3_shdw_pg_event *event,
+                                                              void      *priv_data),
+                                              void *priv_data)
+{
+    struct event_callback *cb,*temp;
+    addr_t flags;
+
+    flags=v3_write_lock_irqsave(&(vm->shdw_impl.event_callback_lock));
+
+    list_for_each_entry_safe(cb,
+                            temp,
+                            &(vm->shdw_impl.event_callback_list),
+                            node) {
+       if ((callback == cb->callback) && (priv_data == cb->priv_data)) { 
+           list_del(&(cb->node));
+           v3_write_unlock_irqrestore(&(vm->shdw_impl.event_callback_lock),flags);
+           V3_Free(cb);
+           return 0;
+       }
     }
-  }
+    
+    v3_write_unlock_irqrestore(&(vm->shdw_impl.event_callback_lock),flags);
 
-  return (addr_t)host_pte;
+    PrintError(vm, VCORE_NONE, "No callback found!\n");
+    
+    return -1;
 }
 
-*/
+