Palacios Public Git Repository

To checkout Palacios execute

  git clone http://v3vee.org/palacios/palacios.web/palacios.git
This will give you the master branch. You probably want the devel branch or one of the release branches. To switch to the devel branch, simply execute
  cd palacios
  git checkout --track -b devel origin/devel
The other branches are similar.


various changes...
[palacios.git] / palacios / src / palacios / vmm_shadow_paging.c
1 /* 
2  * This file is part of the Palacios Virtual Machine Monitor developed
3  * by the V3VEE Project with funding from the United States National 
4  * Science Foundation and the Department of Energy.  
5  *
6  * The V3VEE Project is a joint project between Northwestern University
7  * and the University of New Mexico.  You can find out more at 
8  * http://www.v3vee.org
9  *
10  * Copyright (c) 2008, Jack Lange <jarusl@cs.northwestern.edu> 
11  * Copyright (c) 2008, The V3VEE Project <http://www.v3vee.org> 
12  * All rights reserved.
13  *
14  * Author: Jack Lange <jarusl@cs.northwestern.edu>
15  *
16  * This is free software.  You are permitted to use,
17  * redistribute, and modify it as specified in the file "V3VEE_LICENSE".
18  */
19
20
21 #include <palacios/vmm_shadow_paging.h>
22
23
24 #include <palacios/vmm.h>
25 #include <palacios/vm_guest_mem.h>
26 #include <palacios/vmm_decoder.h>
27 #include <palacios/vmm_ctrl_regs.h>
28
29 #include <palacios/vmm_hashtable.h>
30
31 #include <palacios/vmm_direct_paging.h>
32
33
34 #ifdef CONFIG_SHADOW_PAGING_TELEMETRY
35 #include <palacios/vmm_telemetry.h>
36 #endif
37
38 #ifdef CONFIG_SYMBIOTIC_SWAP
39 #include <palacios/vmm_sym_swap.h>
40 #endif
41
42 #ifndef CONFIG_DEBUG_SHADOW_PAGING
43 #undef PrintDebug
44 #define PrintDebug(fmt, args...)
45 #endif
46
47
48 /*** 
49  ***  There be dragons
50  ***/
51
52
53 struct shadow_page_data {
54     v3_reg_t cr3;
55     addr_t page_pa;
56   
57     struct list_head page_list_node;
58 };
59
60
61
62 static struct shadow_page_data * create_new_shadow_pt(struct guest_info * info);
63 static int inject_guest_pf(struct guest_info * info, addr_t fault_addr, pf_error_t error_code);
64 static int is_guest_pf(pt_access_status_t guest_access, pt_access_status_t shadow_access);
65
66
67 #include "vmm_shadow_paging_32.h"
68 #include "vmm_shadow_paging_32pae.h"
69 #include "vmm_shadow_paging_64.h"
70
71
72
73 #ifdef CONFIG_SHADOW_PAGING_TELEMETRY
74 static void telemetry_cb(struct guest_info * info, void * private_data, char * hdr) {
75     V3_Print("%s Guest Page faults: %d\n", hdr, info->shdw_pg_state.guest_faults);
76 }
77 #endif
78
79
80
81 int v3_init_shadow_page_state(struct guest_info * info) {
82     struct shadow_page_state * state = &(info->shdw_pg_state);
83   
84     state->guest_cr3 = 0;
85     state->guest_cr0 = 0;
86     state->guest_efer.value = 0x0LL;
87
88     INIT_LIST_HEAD(&(state->page_list));
89
90 #ifdef CONFIG_SHADOW_PAGING_TELEMETRY
91     if (info->enable_telemetry) {
92         v3_add_telemetry_cb(info, telemetry_cb, NULL);
93     }
94 #endif
95   
96     return 0;
97 }
98
99
100
101 // Reads the guest CR3 register
102 // creates new shadow page tables
103 // updates the shadow CR3 register to point to the new pts
104 int v3_activate_shadow_pt(struct guest_info * info) {
105     switch (v3_get_vm_cpu_mode(info)) {
106
107         case PROTECTED:
108             return activate_shadow_pt_32(info);
109         case PROTECTED_PAE:
110             return activate_shadow_pt_32pae(info);
111         case LONG:
112         case LONG_32_COMPAT:
113         case LONG_16_COMPAT:
114             return activate_shadow_pt_64(info);
115         default:
116             PrintError("Invalid CPU mode: %s\n", v3_cpu_mode_to_str(v3_get_vm_cpu_mode(info)));
117             return -1;
118     }
119
120     return 0;
121 }
122
123
124
125 // This must flush any caches
126 // and reset the cr3 value to the correct value
127 int v3_invalidate_shadow_pts(struct guest_info * info) {
128     return v3_activate_shadow_pt(info);
129 }
130
131
132 int v3_handle_shadow_pagefault(struct guest_info * info, addr_t fault_addr, pf_error_t error_code) {
133   
134     if (v3_get_vm_mem_mode(info) == PHYSICAL_MEM) {
135         // If paging is not turned on we need to handle the special cases
136         return v3_handle_passthrough_pagefault(info, fault_addr, error_code);
137     } else if (v3_get_vm_mem_mode(info) == VIRTUAL_MEM) {
138
139         switch (v3_get_vm_cpu_mode(info)) {
140             case PROTECTED:
141                 return handle_shadow_pagefault_32(info, fault_addr, error_code);
142                 break;
143             case PROTECTED_PAE:
144                 return handle_shadow_pagefault_32pae(info, fault_addr, error_code);
145             case LONG:
146             case LONG_32_COMPAT:
147             case LONG_16_COMPAT:
148                 return handle_shadow_pagefault_64(info, fault_addr, error_code);
149                 break;
150             default:
151                 PrintError("Unhandled CPU Mode: %s\n", v3_cpu_mode_to_str(v3_get_vm_cpu_mode(info)));
152                 return -1;
153         }
154     } else {
155         PrintError("Invalid Memory mode\n");
156         return -1;
157     }
158 }
159
160
161 int v3_handle_shadow_invlpg(struct guest_info * info) {
162     uchar_t instr[15];
163     struct x86_instr dec_instr;
164     int ret = 0;
165     addr_t vaddr = 0;
166
167     if (v3_get_vm_mem_mode(info) != VIRTUAL_MEM) {
168         // Paging must be turned on...
169         // should handle with some sort of fault I think
170         PrintError("ERROR: INVLPG called in non paged mode\n");
171         return -1;
172     }
173
174     if (v3_get_vm_mem_mode(info) == PHYSICAL_MEM) { 
175         ret = read_guest_pa_memory(info, get_addr_linear(info, info->rip, &(info->segments.cs)), 15, instr);
176     } else { 
177         ret = read_guest_va_memory(info, get_addr_linear(info, info->rip, &(info->segments.cs)), 15, instr);
178     }
179
180     if (ret == -1) {
181         PrintError("Could not read instruction into buffer\n");
182         return -1;
183     }
184
185     if (v3_decode(info, (addr_t)instr, &dec_instr) == -1) {
186         PrintError("Decoding Error\n");
187         return -1;
188     }
189   
190     if ((dec_instr.op_type != V3_OP_INVLPG) || 
191         (dec_instr.num_operands != 1) ||
192         (dec_instr.dst_operand.type != MEM_OPERAND)) {
193         PrintError("Decoder Error: Not a valid INVLPG instruction...\n");
194         return -1;
195     }
196
197     vaddr = dec_instr.dst_operand.operand;
198
199     info->rip += dec_instr.instr_length;
200
201     switch (v3_get_vm_cpu_mode(info)) {
202         case PROTECTED:
203             return handle_shadow_invlpg_32(info, vaddr);
204         case PROTECTED_PAE:
205             return handle_shadow_invlpg_32pae(info, vaddr);
206         case LONG:
207         case LONG_32_COMPAT:
208         case LONG_16_COMPAT:
209             return handle_shadow_invlpg_64(info, vaddr);
210         default:
211             PrintError("Invalid CPU mode: %s\n", v3_cpu_mode_to_str(v3_get_vm_cpu_mode(info)));
212             return -1;
213     }
214 }
215
216
217
218
219 static struct shadow_page_data * create_new_shadow_pt(struct guest_info * info) {
220     struct shadow_page_state * state = &(info->shdw_pg_state);
221     v3_reg_t cur_cr3 = info->ctrl_regs.cr3;
222     struct shadow_page_data * page_tail = NULL;
223     addr_t shdw_page = 0;
224
225     if (!list_empty(&(state->page_list))) {
226         page_tail = list_tail_entry(&(state->page_list), struct shadow_page_data, page_list_node);
227     
228         if (page_tail->cr3 != cur_cr3) {
229             PrintDebug("Reusing old shadow Page: %p (cur_CR3=%p)(page_cr3=%p) \n",
230                        (void *)(addr_t)page_tail->page_pa, 
231                        (void *)(addr_t)cur_cr3, 
232                        (void *)(addr_t)(page_tail->cr3));
233
234             list_move(&(page_tail->page_list_node), &(state->page_list));
235
236             memset(V3_VAddr((void *)(page_tail->page_pa)), 0, PAGE_SIZE_4KB);
237
238
239             return page_tail;
240         }
241     }
242
243     // else  
244
245     page_tail = (struct shadow_page_data *)V3_Malloc(sizeof(struct shadow_page_data));
246     page_tail->page_pa = (addr_t)V3_AllocPages(1);
247
248     PrintDebug("Allocating new shadow Page: %p (cur_cr3=%p)\n", 
249                (void *)(addr_t)page_tail->page_pa, 
250                (void *)(addr_t)cur_cr3);
251
252     page_tail->cr3 = cur_cr3;
253     list_add(&(page_tail->page_list_node), &(state->page_list));
254
255     shdw_page = (addr_t)V3_VAddr((void *)(page_tail->page_pa));
256     memset((void *)shdw_page, 0, PAGE_SIZE_4KB);
257
258     return page_tail;
259 }
260
261
262 static int inject_guest_pf(struct guest_info * info, addr_t fault_addr, pf_error_t error_code) {
263     info->ctrl_regs.cr2 = fault_addr;
264
265 #ifdef CONFIG_SHADOW_PAGING_TELEMETRY
266     info->shdw_pg_state.guest_faults++;
267 #endif
268
269     return v3_raise_exception_with_error(info, PF_EXCEPTION, *(uint_t *)&error_code);
270 }
271
272
273 static int is_guest_pf(pt_access_status_t guest_access, pt_access_status_t shadow_access) {
274     /* basically the reasoning is that there can be multiple reasons for a page fault:
275        If there is a permissions failure for a page present in the guest _BUT_
276        the reason for the fault was that the page is not present in the shadow,
277        _THEN_ we have to map the shadow page in and reexecute, this will generate
278        a permissions fault which is _THEN_ valid to send to the guest
279        _UNLESS_ both the guest and shadow have marked the page as not present
280
281        whew...
282     */
283     if (guest_access != PT_ACCESS_OK) {
284         // Guest Access Error
285
286         if ((shadow_access != PT_ACCESS_NOT_PRESENT) &&
287             (guest_access != PT_ACCESS_NOT_PRESENT)) {
288             // aka (guest permission error)
289             return 1;
290         }
291
292         /*
293           if ((shadow_access == PT_ACCESS_NOT_PRESENT) &&
294           (guest_access == PT_ACCESS_NOT_PRESENT)) {
295           // Page tables completely blank, handle guest first
296           return 1;
297           }
298         */
299
300         if (guest_access == PT_ACCESS_NOT_PRESENT) {
301             // Page tables completely blank, handle guest first
302             return 1;
303         }
304         
305         // Otherwise we'll handle the guest fault later...?
306     }
307
308     return 0;
309 }
310
311