问题描述
有许多数据待拟合,需要从 root 中提取出来,写成文本文件数据量过大,想转成二进制文件。
解决
1 #include "TString.h" 2 #include "TFile.h" 3 #include "TTree.h" 4 5 #include <iostream> 6 #include <fstream> 7 8 // g++ get_root_data.cpp -o get_root_data -Wall `root-config --cflags --libs` 9 10 using std::cout; 11 using std::endl; 12 using std::ofstream; 13 14 const int SIZE = 20000; 15 16 void get_root_data() 17 { 18 TString str("./run_R0035.root"); 19 TFile* fi = new TFile(str); 20 if (!fi) { 21 cout << "无法打开 " << str << endl; 22 return ; 23 } 24 25 TTree* tr = (TTree*)fi->Get("tree"); 26 UShort_t data[SIZE]; 27 UShort_t dt[SIZE]; 28 tr->SetBranchAddress("data", data); 29 tr->SetBranchAddress("dt", dt); 30 31 ofstream data_file; 32 data_file.open("run0035.bin",ofstream::out|ofstream::binary); 33 for(int i=0;i<100000;i++){ 34 tr->GetEntry(i); 35 data_file.write((char*)data,2*SIZE); 36 } 37 data_file.close(); 38 } 39 40 // main() 41 int main(int argc, char* argv[]) 42 { 43 get_root_data(); 44 45 return 0; 46 }
- 打开文件的标识符,out | binary
- write(char*, int) 函数,写入多少个char大小的内容,这里的 data 是一个数组,需要先转化为 char 类型。再考虑其大小,数组中每个元素是 2 Byte,数组长度是 20000,因此写入 40000 个 char。
有一个困惑?
data 中每一个元素是 2 Bytes,如果我用 write() 函数,每次写入 2 Byte,那么数组的顺序在二进制文件中是不变的;如果我一下子将 20000 个元素全部写入,那数组的顺序是否会发生变化?如果每次写入 4 Byte,又会怎么样?每次写入 1 Byte,会怎么样?
一个猜想
在 c++ 的写入中,write() 函数最小的单位是字节,所以是按字节写入的,在使用 hexdump 命令查看时,会将 2 Bytes 的内容一起显示,比如将 2604 显示为 0a2c,其实在文件中 2c 是第一个字节,0a 是第二个字节。因此我在读取时,需要已知该二进制文件中储存数据的结构,即多少个字节代表一个数(甚至是更复杂的对应关系),这样读取就不会有问题。比如在这里,如果我每次读取 3 Bytes 的数据,那肯定就错了。