Palacios Public Git Repository

To checkout Palacios execute

  git clone http://v3vee.org/palacios/palacios.web/palacios.git
This will give you the master branch. You probably want the devel branch or one of the release branches. To switch to the devel branch, simply execute
  cd palacios
  git checkout --track -b devel origin/devel
The other branches are similar.


added translation functions
[palacios.git] / palacios / include / palacios / vmm_paging.h
1 /*
2  * This file is part of the Palacios Virtual Machine Monitor developed
3  * by the V3VEE Project with funding from the United States National 
4  * Science Foundation and the Department of Energy.  
5  *
6  * The V3VEE Project is a joint project between Northwestern University
7  * and the University of New Mexico.  You can find out more at 
8  * http://www.v3vee.org
9  *
10  * Copyright (c) 2008, Jack Lange <jarusl@cs.northwestern.edu> 
11  * Copyright (c) 2008, The V3VEE Project <http://www.v3vee.org> 
12  * All rights reserved.
13  *
14  * Author: Jack Lange <jarusl@cs.northwestern.edu>
15  *
16  * This is free software.  You are permitted to use,
17  * redistribute, and modify it as specified in the file "V3VEE_LICENSE".
18  */
19
20
21 #ifndef __VMM_PAGING_H__
22 #define __VMM_PAGING_H__
23
24
25 #ifdef __V3VEE__
26
27 #include <palacios/vmm_types.h>
28 #include <palacios/vmm_util.h>
29
30
31 /*
32
33 In the following, when we say "page table", we mean the whole 2 or 4 layer
34 page table (PDEs, PTEs), etc.
35
36
37 guest-visible paging state
38  This is the state that the guest thinks the machine is using
39  It consists of
40    - guest physical memory
41        The physical memory addresses the guest is allowed to use
42        (see shadow page maps, below)
43    - guest page tables 
44        (we care about when the current one changes)
45    - guest paging registers (these are never written to hardware)
46         CR0
47         CR3
48
49
50 shadow paging state
51  This the state that the machine will actually use when the guest
52  is running.  It consists of:
53    - current shadow page table
54         This is the page table actually useed when the guest is running.
55         It is changed/regenerated when the guest page table changes
56         It mostly reflects the guest page table, except that it restricts 
57         physical addresses to those the VMM allocates to the guest.
58    - shadow page maps
59         This is a mapping from guest physical memory addresses to
60         the current location of the guest physical memory content.   
61         It maps from regions of physical memory addresses to regions 
62         located in physical memory or elsewhere.  
63         (8192,16384) -> MEM(8912,...)
64         (0,8191) -> DISK(65536,..) 
65    - guest paging registers (these are written to guest state)
66         CR0
67         CR3
68
69 host paging state
70   This is the state we expect to be operative when the VMM is running.
71   Typically, this is set up by the host os into which we have embedded
72   the VMM, but we include the description here for clarity.
73     - current page table
74         This is the page table we use when we are executing in 
75         the VMM (or the host os)
76     - paging regisers
77         CR0
78         CR3
79
80
81 The reason why the shadow paging state and the host paging state are
82 distinct is to permit the guest to use any virtual address it wants,
83 irrespective of the addresses the VMM or the host os use.  These guest
84 virtual addresses are reflected in the shadow paging state.  When we
85 exit from the guest, we switch to the host paging state so that any
86 virtual addresses that overlap between the guest and VMM/host now map
87 to the physical addresses epxected by the VMM/host.  On AMD SVM, this
88 switch is done by the hardware.  On Intel VT, the switch is done
89 by the hardware as well, but we are responsible for manually updating
90 the host state in the vmcs before entering the guest.
91 */
92
93
94
95
96 #define MAX_PTE32_ENTRIES          1024
97 #define MAX_PDE32_ENTRIES          1024
98
99 #define MAX_PTE32PAE_ENTRIES       512
100 #define MAX_PDE32PAE_ENTRIES       512
101 #define MAX_PDPE32PAE_ENTRIES      4
102
103 #define MAX_PTE64_ENTRIES          512
104 #define MAX_PDE64_ENTRIES          512
105 #define MAX_PDPE64_ENTRIES         512
106 #define MAX_PML4E64_ENTRIES        512
107
108
109 /* Converts an address into a page table index */
110 #define PDE32_INDEX(x)  ((((uint_t)x) >> 22) & 0x3ff)
111 #define PTE32_INDEX(x)  ((((uint_t)x) >> 12) & 0x3ff)
112
113
114 #define PDPE32PAE_INDEX(x) ((((uint_t)x) >> 30) & 0x3)
115 #define PDE32PAE_INDEX(x)  ((((uint_t)x) >> 21) & 0x1ff)
116 #define PTE32PAE_INDEX(x)  ((((uint_t)x) >> 12) & 0x1ff)
117
118 #define PML4E64_INDEX(x) ((((ullong_t)x) >> 39) & 0x1ff)
119 #define PDPE64_INDEX(x) ((((ullong_t)x) >> 30) & 0x1ff)
120 #define PDE64_INDEX(x) ((((ullong_t)x) >> 21) & 0x1ff)
121 #define PTE64_INDEX(x) ((((ullong_t)x) >> 12) & 0x1ff)
122
123
124 /* Gets the base address needed for a Page Table entry */
125 /* Deprecate these :*/
126 /*
127   #define PD32_BASE_ADDR(x) (((uint_t)x) >> 12)
128   #define PT32_BASE_ADDR(x) (((uint_t)x) >> 12)
129   #define PD32_4MB_BASE_ADDR(x) (((uint_t)x) >> 22)
130   
131   #define PML4E64_BASE_ADDR(x) (((ullong_t)x) >> 12)
132   #define PDPE64_BASE_ADDR(x) (((ullong_t)x) >> 12)
133   #define PDE64_BASE_ADDR(x) (((ullong_t)x) >> 12)
134   #define PTE64_BASE_ADDR(x) (((ullong_t)x) >> 12)
135   
136   // Accessor functions for the page table structures 
137   #define PDE32_T_ADDR(x) (((x).pt_base_addr) << 12)
138   #define PTE32_T_ADDR(x) (((x).page_base_addr) << 12)
139   #define PDE32_4MB_T_ADDR(x) (((x).page_base_addr) << 22)
140 */
141 /* Replace The above with these... */
142 #define PAGE_BASE_ADDR(x) ((x) >> 12)
143 #define PAGE_BASE_ADDR_2MB(x) ((x) >> 21)
144 #define PAGE_BASE_ADDR_4MB(x) ((x) >> 22)
145
146 #define BASE_TO_PAGE_ADDR(x) (((addr_t)x) << 12)
147 #define BASE_TO_PAGE_ADDR_2MB(x) (((addr_t)x) << 21)
148 #define BASE_TO_PAGE_ADDR_4MB(x) (((addr_t)x) << 22)
149 /* *** */
150
151 /* Deprecated */
152 /*
153   #define PT32_PAGE_OFFSET(x) (((uint_t)x) & 0xfff)
154   #define PD32_4MB_PAGE_OFFSET(x) (((uint_t)x) & 0x003fffff)
155   
156   #define PT32_PAGE_ADDR(x)   (((uint_t)x) & 0xfffff000)
157   #define PD32_4MB_PAGE_ADDR(x) (((uint_t)x) & 0xffc00000)
158   
159   #define PT32_PAGE_POWER 12
160   #define PAGE_ALIGNED_ADDR(x)   (((uint_t) (x)) >> 12)
161   //#define PAGE_ADDR(x)   (PAGE_ALIGNED_ADDR(x) << 12)
162   #define PAGE_POWER 12
163   #define PAGE_SIZE 4096
164 */
165 /* use these instead */
166 #define PAGE_OFFSET(x) ((x) & 0xfff)
167 #define PAGE_OFFSET_2MB(x) ((x) & 0x1fffff)
168 #define PAGE_OFFSET_4MB(x) ((x) & 0x3fffff)
169
170 #define PAGE_POWER 12
171 #define PAGE_POWER_2MB 22
172 #define PAGE_POWER_4MB 21
173
174 // We shift instead of mask because we don't know the address size
175 #define PAGE_ADDR(x) (((x) >> PAGE_POWER) << PAGE_POWER)
176 #define PAGE_ADDR_2MB(x) (((x) >> PAGE_POWER_2MB) << PAGE_POWER_2MB)
177 #define PAGE_ADDR_4MB(x) (((x) >> PAGE_POWER_4MB) << PAGE_POWER_4MB)
178
179 #define PAGE_SIZE 4096
180 #define PAGE_SIZE_2MB (4096 * 512)
181 #define PAGE_SIZE_4MB (4096 * 1024)
182
183
184 /* *** */
185
186
187
188
189
190 #define CR3_TO_PDE32_PA(cr3) ((addr_t)(((uint_t)cr3) & 0xfffff000))
191 #define CR3_TO_PDPE32PAE_PA(cr3) ((addr_t)(((uint_t)cr3) & 0xffffffe0))
192 #define CR3_TO_PML4E64_PA(cr3)  ((addr_t)(((ullong_t)cr3) & 0x000ffffffffff000LL))
193
194 #define CR3_TO_PDE32_VA(cr3) ((pde32_t *)V3_VAddr((void *)(addr_t)(((uint_t)cr3) & 0xfffff000)))
195 #define CR3_TO_PDPE32PAE_VA(cr3) ((pdpe32pae_t *)V3_VAddr((void *)(addr_t)(((uint_t)cr3) & 0xffffffe0)))
196 #define CR3_TO_PML4E64_VA(cr3)  ((pml4e64_t *)V3_VAddr((void *)(addr_t)(((ullong_t)cr3) & 0x000ffffffffff000LL)))
197
198
199
200
201
202
203 /* Page Table Flag Values */
204 #define PT32_HOOK 0x1
205 #define PT32_GUEST_PT 0x2
206
207
208
209 /* We'll use the general form for now.... 
210    typedef enum {PDE32_ENTRY_NOT_PRESENT, PDE32_ENTRY_PTE32, PDE32_ENTRY_LARGE_PAGE} pde32_entry_type_t;
211    typedef enum {PTE32_ENTRY_NOT_PRESENT, PTE32_ENTRY_PAGE} pte32_entry_type_t;
212    
213    typedef enum {PDPE32PAE_ENTRY_NOT_PRESENT, PDPE32PAE_ENTRY_PAGE} pdpe32pae_entry_type_t;
214    typedef enum {PDE32PAE_ENTRY_NOT_PRESENT, PDE32PAE_ENTRY_PTE32, PDE32PAE_ENTRY_LARGE_PAGE} pde32pae_entry_type_t;
215    typedef enum {PTE32PAE_ENTRY_NOT_PRESENT, PTE32PAE_ENTRY_PAGE} pte32pae_entry_type_t;
216    
217    typedef enum {PML4E64_ENTRY_NOT_PRESENT, PML4E64_ENTRY_PAGE} pml4e64_entry_type_t;
218    typedef enum {PDPE64_ENTRY_NOT_PRESENT, PDPE64_ENTRY_PTE32, PDPE64_ENTRY_LARGE_PAGE} pdpe64_entry_type_t;
219    typedef enum {PDE64_ENTRY_NOT_PRESENT, PDE64_ENTRY_PTE32, PDE64_ENTRY_LARGE_PAGE} pde64_entry_type_t;
220    typedef enum {PTE64_ENTRY_NOT_PRESENT, PTE64_ENTRY_PAGE} pte64_entry_type_t;
221 */
222
223
224 typedef enum {PT_ENTRY_NOT_PRESENT, PT_ENTRY_LARGE_PAGE, PT_ENTRY_PAGE} pt_entry_type_t;
225 typedef enum {PT_ACCESS_OK, PT_ACCESS_NOT_PRESENT, PT_ACCESS_WRITE_ERROR, PT_ACCESS_USER_ERROR} pt_access_status_t;
226
227 typedef struct pde32 {
228   uint_t present         : 1;
229   uint_t writable        : 1;
230   uint_t user_page       : 1;
231   uint_t write_through   : 1;
232   uint_t cache_disable   : 1;
233   uint_t accessed        : 1;
234   uint_t reserved        : 1;
235   uint_t large_page     : 1;
236   uint_t global_page     : 1;
237   uint_t vmm_info        : 3;
238   uint_t pt_base_addr    : 20;
239 } __attribute__((packed))  pde32_t;
240
241 typedef struct pde32_4MB {
242   uint_t present         : 1;
243   uint_t writable        : 1;
244   uint_t user_page       : 1;
245   uint_t write_through   : 1;
246   uint_t cache_disable   : 1;
247   uint_t accessed        : 1;
248   uint_t dirty           : 1;
249   uint_t large_page      : 1;
250   uint_t global_page     : 1;
251   uint_t vmm_info        : 3;
252   uint_t pat             : 1;
253   uint_t rsvd            : 9;
254   uint_t page_base_addr  : 10;
255
256 } __attribute__((packed))  pde32_4MB_t;
257
258 typedef struct pte32 {
259   uint_t present         : 1;
260   uint_t writable        : 1;
261   uint_t user_page       : 1;
262   uint_t write_through   : 1;
263   uint_t cache_disable   : 1;
264   uint_t accessed        : 1;
265   uint_t dirty           : 1;
266   uint_t pte_attr        : 1;
267   uint_t global_page     : 1;
268   uint_t vmm_info        : 3;
269   uint_t page_base_addr  : 20;
270 }  __attribute__((packed)) pte32_t;
271 /* ***** */
272
273 /* 32 bit PAE PAGE STRUCTURES */
274 typedef struct pdpe32pae {
275   uint_t present       : 1;
276   uint_t rsvd          : 2; // MBZ
277   uint_t write_through : 1;
278   uint_t cache_disable : 1;
279   uint_t accessed      : 1; 
280   uint_t avail         : 1;
281   uint_t rsvd2         : 2;  // MBZ
282   uint_t vmm_info      : 3;
283   uint_t pd_base_addr  : 24;
284   uint_t rsvd3         : 28; // MBZ
285 } __attribute__((packed)) pdpe32pae_t;
286
287
288
289 typedef struct pde32pae {
290   uint_t present         : 1;
291   uint_t writable        : 1;
292   uint_t user_page       : 1;
293   uint_t write_through   : 1;
294   uint_t cache_disable   : 1;
295   uint_t accessed        : 1;
296   uint_t avail           : 1;
297   uint_t large_page      : 1;
298   uint_t global_page     : 1;
299   uint_t vmm_info        : 3;
300   uint_t pt_base_addr    : 24;
301   uint_t rsvd            : 28;
302 } __attribute__((packed)) pde32pae_t;
303
304 typedef struct pde32pae_2MB {
305   uint_t present         : 1;
306   uint_t writable        : 1;
307   uint_t user_page       : 1;
308   uint_t write_through   : 1;
309   uint_t cache_disable   : 1;
310   uint_t accessed        : 1;
311   uint_t dirty           : 1;
312   uint_t one             : 1;
313   uint_t global_page     : 1;
314   uint_t vmm_info        : 3;
315   uint_t pat             : 1;
316   uint_t rsvd            : 8;
317   uint_t page_base_addr  : 15;
318   uint_t rsvd2           : 28;
319
320 } __attribute__((packed)) pde32pae_2MB_t;
321
322 typedef struct pte32pae {
323   uint_t present         : 1;
324   uint_t writable        : 1;
325   uint_t user_page       : 1;
326   uint_t write_through   : 1;
327   uint_t cache_disable   : 1;
328   uint_t accessed        : 1;
329   uint_t dirty           : 1;
330   uint_t pte_attr        : 1;
331   uint_t global_page     : 1;
332   uint_t vmm_info        : 3;
333   uint_t page_base_addr  : 24;
334   uint_t rsvd            : 28;
335 } __attribute__((packed)) pte32pae_t;
336
337
338
339
340
341 /* ********** */
342
343
344 /* LONG MODE 64 bit PAGE STRUCTURES */
345 typedef struct pml4e64 {
346   uint_t present        : 1;
347   uint_t writable       : 1;
348   uint_t user_page           : 1;
349   uint_t write_through  : 1;
350   uint_t cache_disable  : 1;
351   uint_t accessed       : 1;
352   uint_t reserved       : 1;
353   uint_t zero           : 2;
354   uint_t vmm_info       : 3;
355   ullong_t pdp_base_addr : 40;
356   uint_t available      : 11;
357   uint_t no_execute     : 1;
358 } __attribute__((packed)) pml4e64_t;
359
360
361 typedef struct pdpe64 {
362   uint_t present        : 1;
363   uint_t writable       : 1;
364   uint_t user_page      : 1;
365   uint_t write_through  : 1;
366   uint_t cache_disable  : 1;
367   uint_t accessed       : 1;
368   uint_t avail          : 1;
369   uint_t large_page     : 1;
370   uint_t zero           : 1;
371   uint_t vmm_info       : 3;
372   ullong_t pd_base_addr : 40;
373   uint_t available      : 11;
374   uint_t no_execute     : 1;
375 } __attribute__((packed)) pdpe64_t;
376
377
378 // We Don't support this
379 typedef struct pdpe64_1GB {
380   uint_t present        : 1;
381   uint_t writable       : 1;
382   uint_t user_page      : 1;
383   uint_t write_through  : 1;
384   uint_t cache_disable  : 1;
385   uint_t accessed       : 1;
386   uint_t dirty          : 1;
387   uint_t large_page     : 1;
388   uint_t global_page    : 1;
389   uint_t vmm_info       : 3;
390   uint_t pat            : 1;
391   uint_t rsvd           : 17;
392   ullong_t page_base_addr : 22;
393   uint_t available      : 11;
394   uint_t no_execute     : 1;
395 } __attribute__((packed)) pdpe64_1GB_t;
396
397
398
399 typedef struct pde64 {
400   uint_t present         : 1;
401   uint_t writable        : 1;
402   uint_t user_page       : 1;
403   uint_t write_through   : 1;
404   uint_t cache_disable   : 1;
405   uint_t accessed        : 1;
406   uint_t avail           : 1;
407   uint_t large_page      : 1;
408   uint_t global_page     : 1;
409   uint_t vmm_info        : 3;
410   ullong_t pt_base_addr  : 40;
411   uint_t available       : 11;
412   uint_t no_execute      : 1;
413 } __attribute__((packed)) pde64_t;
414
415 typedef struct pde64_2MB {
416   uint_t present         : 1;
417   uint_t writable        : 1;
418   uint_t user_page       : 1;
419   uint_t write_through   : 1;
420   uint_t cache_disable   : 1;
421   uint_t accessed        : 1;
422   uint_t dirty           : 1;
423   uint_t large_page      : 1;
424   uint_t global_page     : 1;
425   uint_t vmm_info        : 3;
426   uint_t pat             : 1;
427   uint_t rsvd            : 8;
428   ullong_t page_base_addr  : 31;
429   uint_t available       : 11;
430   uint_t no_execute      : 1;
431 } __attribute__((packed)) pde64_2MB_t;
432
433
434 typedef struct pte64 {
435   uint_t present         : 1;
436   uint_t writable        : 1;
437   uint_t user_page       : 1;
438   uint_t write_through   : 1;
439   uint_t cache_disable   : 1;
440   uint_t accessed        : 1;
441   uint_t dirty           : 1;
442   uint_t pte_attr        : 1;
443   uint_t global_page     : 1;
444   uint_t vmm_info        : 3;
445   ullong_t page_base_addr : 40;
446   uint_t available       : 11;
447   uint_t no_execute      : 1;
448 } __attribute__((packed)) pte64_t;
449
450 /* *************** */
451
452 typedef struct pf_error_code {
453   uint_t present           : 1; // if 0, fault due to page not present
454   uint_t write             : 1; // if 1, faulting access was a write
455   uint_t user              : 1; // if 1, faulting access was in user mode
456   uint_t rsvd_access       : 1; // if 1, fault from reading a 1 from a reserved field (?)
457   uint_t ifetch            : 1; // if 1, faulting access was an instr fetch (only with NX)
458   uint_t rsvd              : 27;
459 } __attribute__((packed)) pf_error_t;
460
461
462
463
464 void delete_page_tables_32(pde32_t * pde);
465 void delete_page_tables_32PAE(pdpe32pae_t * pdpe);
466 void delete_page_tables_64(pml4e64_t *  pml4);
467
468 struct guest_info;
469
470 int v3_translate_guest_pt_32(struct guest_info * info, addr_t guest_cr3, addr_t vaddr, addr_t * paddr);
471 int v3_translate_guest_pt_32pae(struct guest_info * info, addr_t guest_cr3, addr_t vaddr, addr_t * paddr);
472 int v3_translate_guest_pt_64(struct guest_info * info, addr_t guest_cr3, addr_t vaddr, addr_t * paddr);
473
474 int v3_translate_host_pt_32(addr_t host_cr3, addr_t vaddr, addr_t * paddr);
475 int v3_translate_host_pt_32pae(addr_t host_cr3, addr_t vaddr, addr_t * paddr);
476 int v3_translate_host_pt_64(addr_t host_cr3, addr_t vaddr, addr_t * paddr);
477
478
479 /* Should these be static? */
480 pt_entry_type_t pde32_lookup(pde32_t * pd, addr_t addr, addr_t * entry);
481 pt_entry_type_t pte32_lookup(pte32_t * pt, addr_t addr, addr_t * entry);
482
483 pt_entry_type_t pdpe32pae_lookup(pdpe32pae_t * pdp, addr_t addr, addr_t * entry);
484 pt_entry_type_t pde32pae_lookup(pde32pae_t * pd, addr_t addr, addr_t * entry);
485 pt_entry_type_t pte32pae_lookup(pte32pae_t * pt, addr_t addr, addr_t * entry);
486
487 pt_entry_type_t pml4e64_lookup(pml4e64_t * pml, addr_t addr, addr_t * entry);
488 pt_entry_type_t pdpe64_lookup(pdpe64_t * pdp, addr_t addr, addr_t * entry);
489 pt_entry_type_t pde64_lookup(pde64_t * pd, addr_t addr, addr_t * entry);
490 pt_entry_type_t pte64_lookup(pte64_t * pt, addr_t addr, addr_t * entry);
491
492
493
494
495
496
497 pt_access_status_t can_access_pde32(pde32_t * pde, addr_t addr, pf_error_t access_type);
498 pt_access_status_t can_access_pte32(pte32_t * pte, addr_t addr, pf_error_t access_type);
499
500
501
502
503
504 struct guest_info;
505
506 pde32_t * create_passthrough_pts_32(struct guest_info * guest_info);
507 pdpe32pae_t * create_passthrough_pts_32PAE(struct guest_info * guest_info);
508 pml4e64_t * create_passthrough_pts_64(struct guest_info * info);
509
510
511
512
513 //#include <palacios/vm_guest.h>
514
515 void PrintDebugPageTables(pde32_t * pde);
516
517
518 void PrintPageTree(v3_vm_cpu_mode_t cpu_mode, addr_t virtual_addr, addr_t cr3);
519 void PrintPageTree_64(addr_t virtual_addr, pml4e64_t * pml);
520
521
522 void PrintPT32(addr_t starting_address, pte32_t * pte);
523 void PrintPD32(pde32_t * pde);
524 void PrintPTE32(addr_t virtual_address, pte32_t * pte);
525 void PrintPDE32(addr_t virtual_address, pde32_t * pde);
526   
527 void PrintDebugPageTables32PAE(pdpe32pae_t * pde);
528 void PrintPTE32PAE(addr_t virtual_address, pte32pae_t * pte);
529 void PrintPDE32PAE(addr_t virtual_address, pde32pae_t * pde);
530 void PrintPTE64(addr_t virtual_address, pte64_t * pte);
531
532 #endif // !__V3VEE__
533
534
535
536 #endif