您当前的位置:首页 > 计算机 > 文件格式与编码

FAT32文件系统格式详解(图文针对具体文件存储,分析fat32 SD卡)

时间:04-17来源:作者:点击数:

一. 用winhex工具分析SD卡(FAT32)

WinHex.exe -> 工具 ->打开磁盘 ->选中SD卡设备


图(1)

打开后主界面如下:


图(2)

二. FAT32磁盘格式分析

当磁盘有多个分区时:

fat32磁盘是由 MBR + 分区1(保留区 + 文件分配表 + 数据区)+ 分区2 + ......

其实,当我们在电脑上面,看到的U盘/SD卡设备,就是如上图红色选择部分,是不包括MBR部分的


图(3)

0x00000000 - 0x0013B000 保留区(DBR + FSINFO + ...)

0x0013B000 - 0x0089D800 FAT1

0x0089D800 - 0x01000000 FAT2

0x01000000 - 数据区


图(4)

三. 分析二进制数据(DBR FSINFO FAT1 FAT2 数据)

(1)启动扇区(DBR)


图(5)

0xEB 0x58 0x90: 跳转指令

0x54 0x48 0x52 0x45 0x45 0x53 0x20 0x20: 文件系统标志和版本号MSDOS5.0

0x00 0x20: 0x200 (512)每个扇区512字节

0x08: 最小单元(簇)为0x08(8)扇区,8*512=4K

0xD8 0x09: 0x9D8(2520)保留扇区2520个 2520*512=1.2M

 

0x02 : 2个FAT表(FAT1 FAT2)

0xF8 : 存储介质类型,F8标准值

 

0x46 0xCC 0xEC 0x00:文件系统总的扇区数:15518790 15518790*512=7.39G

0x14 0x3B 0x00 0x00:每个fat表占用的扇区总数:15124 15124*512 = 7.4M

0x02 0x00 0x00 0x00: 根目录所在第一个簇的簇号,通常情况下,根目录簇号为2

 

0x46 0x41 0x54 0x33 0x32 0x20 0x20 0x20:文件系统格式 FAT32

(2)信息扇区(FSINFO)


图(6)

0x52 0x52 0x61 0x41: 扩展引导标志

0x72 0x72 0x41 0x61: FSINFO签名

0x84 0x89 0x1D 0x00: 剩余所有的簇总数 0x1D8984 * 4k = 7928823808 byte = 7.38G

0x06 0x00: 下一个可用簇:6

0x55 0xAA: 结束标记字符

(3)文件分配表(FAT1)

在分析FAT表之前,我们先理解一下FAT32文件系统的一些基本信息:

扇区: 512字节

:文件系统的最小单元,多个连续的扇区组成,本SD卡为 4K(8个扇区,必须为2的整数次幂),最大支持32K(64个扇区),当我们保存一个1K的文件时,实际上,在文件系统中,是占用的是4K的空间大小,因为最小的存储单元是4K,当我们保存一个10K的文件时,那么它需要占用三个簇,实际占用空间大小为12K。

FAT:FileAllocationTable,文件分配表,当我们存储10K的文件时,需要使用三个簇,但是一定连续的三个簇吗?并非一定是连续的,那么如何知道是使用了哪三个族呢,就需要我们文件分配表来记录了,第一个簇的地址,下一个簇是哪个,哪个是最后的结束簇。

FAT 是一组与数据簇号对应的列表,所有簇从2开始进行编号,每个簇都有一个自己的地址编号,根目录默认簇号是为2

FAT32中每个簇的簇地址是有32bit(4个字节),FAT表中的所有字节位置以4字节为单位进行划分,并对所有划分后的位置由0进行地址编号。0号地址与1号地址被系统保留并存储特殊标志内容。从2号地址开始,每个地址对应于数据区的簇号,FAT表中的地址编号与数据区中的簇号相同。我们称FAT表中的这些地址为FAT表项,FAT表项中记录的值称为FAT表项值。(没理解的请反复多读几遍,至关重要)

当文件系统被创建,也就是进行格式化操作时,分配给FAT区域的空间将会被清空,在FAT1与FAT2的0号表项与1号表项写入特定值。由于创建文件系统的同时也会创建根目录,也就是为根目录分配了一个簇空间,通常为2号簇,与之对应的2号FAT表项记录为2号簇,被写入一个结束标记。

几点说明:

(1) 由于簇号起始于2号,所以FAT表项的0号表项与1号表项不与任何簇对应。FAT32的0号表项值总是“F8FFFF0F”。

(2)1号表项可能被用于记录脏标志,以说明文件系统没有被正常卸载或者磁盘表面存在错误。不过这个值并不重要。正常情况下1号表项的值为“FFFFFFFF”或“FFFFFF0F”。

(3)如果某个簇未被分配使用,它对应的FAT表项内容为0;

(4)当某个簇已被分配使用,则它对应的FAT表项内的FAT表项值也就是该文件的下一个存储位置的簇号。如果该文件结束于该簇,则在它的FAT表项中记录的是一个文件结束标记,对于FAT32而言,代表文件结束的FAT表项值为0x0FFFFFFF

(5)如果某个簇存在坏扇区,则整个簇会用0xFFFFFF7标记为坏簇,这个坏簇标记就记录在它所对应的FAT表项中。

(6)在文件系统中新建文件时,如果新建的文件只占用一个簇,为其分配的簇对应的FAT表项将会写入结束标记。如果新建的文件不只占用一个簇,则在其所占用的每个簇对应的FAT表项中写入为其分配的下一簇的簇号,在最后一个簇对应的FAT表象中写入结束标记。

(7)新建目录时,只为其分配一个簇的空间,对应的FAT表项中写入结束标记。当目录增大超出一个簇的大小时,将会在空闲空间中继续为其分配一个簇,并在FAT表中为其建立FAT表链以描述它所占用的簇情况。


图(7)

【0号表项】:0x0FFFFFF8; FAT表起始固定标识

【1号表项】:0xFFFFFFFF; 默认值

【2号表项】:0x0FFFFFFF; 根目录 Rootdirectory 所在簇,开始扇区32768

【3号表项】:0x0FFFFFFF; 目录 SystemVolumeInformation 所在簇,开始扇区32776 (32768+8)

【4号表项】:0x0FFFFFFF; 文件 WPSettings.dat 所在簇,开始扇区32784 (32776+8)

【5号表项】:0x0FFFFFFF; 文件 IndexerVolumeGuid 所在簇,开始扇区32792 (32784+8)

由于我们是把SD卡格式化后分析,所以fat32除了根目录外,无其他我们存储文件,我们拷贝一个build.log文件再分析。build.log的大小为10k,需要占用三个簇。


图(8)

图(9)

【6号表项】:0x07 表项值为7,即指向下一个表项, 2号簇为根目录,对应的开始扇区为32768, 6号簇。开始的扇区为 32768 + 8 * (6-2)= 32800,即为build.log的开始扇区。

【7号表项】:0x08 表项值为8,即指向下一个表项。

【8号表项】: 0x0FFFFFFF,结束簇,从6号簇build.log开始,到8号簇,文件结束。

到此,build.log的文件如何存储的,我们弄明白了,整个build.log保存在 6号簇-8号簇,三个族存储了build.log内的数据,但是build.log的文件名/文件属性/最后修改时间/最后保存时间这些信息保存在哪里呢?

由于build.log是存放在根目录下的,那我们来看下根目录的二进制数据:


图(10)

在查看根目录的二进制数据之前,我们还是先普及下基本信息:

(1)目录所在的扇区,都是以32 Bytes划分为一个单位,每个单位称为一个目录项。

(2)根据文件名及后缀,我们可以分为短目录文件,长目录文件,简单点理解,如果文件名>8 byte或者后缀名>3,则为长文件目录,否则为短文件目录

我们查看build.log(短文件目录)


图(11)

图(12)

文件名:build

后缀名:log

属性: 0x20 (0010 0000)读写归档

簇号: 0x06开始簇号

大小: 0x2800 10K

至此,build.log的文件名称以及相关的属性信息,以及build.log文件的内容存储,都已经明白。

如果是长文件目录


图(13)

不再对具体的长文件目录进行分析。

(4)文件分配表(FAT2)

FAT2与FAT1完全相同

(5)数据区

方便获取更多学习、工作、生活信息请关注本站微信公众号城东书院 微信服务号城东书院 微信订阅号
推荐内容
相关内容
栏目更新
栏目热门