
2.2.3 读入纯文本数据文件
纯文本数据文件是计算机各种软件中最通用的一种格式文件,其没有保存格式,因此其文件很小。根据纯文本数据文件中数据的排序方式,可以将其分为自由格式和固定格式。
前者的文本文件的每个个案的变量数目、排列顺序固定,但数据项的长度可以不同,且数据项之间必须有分隔符(逗号、空格、Tab键等);后者的文本文件要求每个个案的变量数目、排列顺序、变量取值长度都固定不变,且数据项之间不需要分隔符。现以实例说明两种不同的数据读入方法。
1.以自由格式读入数据
实例二:“data02-02.txt”数据文件是纯文本数据,如图2-8所示。现要求以自由格式读入数据。

(1)打开“data02-02.txt”数据文件,选择“文件”→“打开”→“数据”,弹出如图2-9所示的对话框,在其中选择目标文件“data02-02.txt”并单击“打开”按钮,打开数据文件(图2-9),SPSS随即启动文本数据导入的引导窗口。

图2-8 “data02-02.txt”部分数据

图2-9 “打开数据”对话框
(2)弹出“文本导入向导-第1/6步”对话框,如图2-10所示。在该对话框中可以看见文本文件中的数据信息。单击“下一步”按钮进入下一步。
(3)弹出“文本导入向导-第2/6步”对话框,如图2-11所示。在“变量如何排列?”“文件开头是否包括变量名?”和“小数符号是什么?”选框中分别选择“定界”“否”“句点”。单击“下一步”按钮进入下一步。

图2-10 “文本导入向导-第1/6步”对话框

图2-11 “文本导入向导-第2/6步”对话框
(4)弹出“文本导入向导-定界,第3/6步”对话框,如图2-12所示。按照图示填写和选择相应的内容。单击“下一步”按钮进入下一步。
(5)弹出“文本导入向导-定界,第4/6步”对话框,如图2-13所示。在“变量之间存在哪些定界符?”选框中选择文本文件的分隔符,有制表符(即Tab键分隔符)、空格、逗号、分号和其他,本次选择制表符。单击“下一步”按钮进入下一步。

图2-12 “文本导入向导-定界,第3/6步”对话框

图2-13 “文本导入向导-定界,第4/6步”对话框
(6)弹出“文本导入向导-第5/6步”对话框,如图2-14所示。在此对话框中的下面是数据的文件预览,这时用户需要注意查看各变量的长度是否正确。单击“下一步”按钮进入下一步。
(7)弹出“文本导入向导-第6/6步”对话框,如图2-15所示。单击“完成”即成功读入自由格式的文本文件内容。
此时若想保存前几步操作中所定义的读取自由格式的文本文件信息,可以在该对话框中的“您要保存此文件格式以供将来使用吗?”中选择“是”选项,然后单击右边的“另存为”按钮,保存格式信息。单击“完成”按钮完成文本的导入工作。

图2-14 “文本导入向导-第5/6步”对话框

图2-15 “文本导入向导-第6/6步”对话框
(8)SPSS顺利读入数据后,用户需要在变量视图中重新定义变量名,并进行宽度、小数位数等设置,如图2-16所示。

图2-16 显示读入数据的变量视图
2.以固定格式读入数据
实例三:“data02-03.txt”数据文件是纯文本数据,如图2-17所示。现要求以固定格式读入数据。

(1)选择“文件”→“打开”→“数据”,在弹出的对话框中选择目标文件“data02-03.txt”(图2-18),并单击“打开”按钮打开如图2-17所示的数据文件,SPSS随即启动文本数据导入的引导窗口。

图2-17 固定格式的纯文本数据

图2-18 “打开数据”对话框
(2)弹出“文本导入向导-第1/6步”对话框,如图2-19所示。在该对话框中可以看见文本文件中的数据信息。单击“下一步”按钮进入下一步。
(3)弹出“文本导入向导-第2/6步”对话框,如图2-20所示。在“变量如何排列?”“文件开头是否包括变量名?”和“小数符号是什么?”选框中分别选择“定界”“否”“句点”。单击“下一步”按钮进入下一步。

图2-19 “文本导入向导-第1/6步”对话框

图2-20 “文本导入向导-第2/6步”对话框
(4)弹出“文本导入向导-定界,第3/6步”对话框,如图2-21所示。按照图示填写和选择相应的内容。单击“下一步”按钮进入下一步。
(5)弹出“文本导入向导-定界,第4/6步”对话框,如图2-22所示。前两列数据属于第一个变量,在第二列和第三列之间单击鼠标左键即可添加一条分割线;利用同样方法在第三列和第四列之间添加分割线,将第二个、第三个变量分隔出来。单击“下一步”按钮进入下一步。

图2-21 “文本导入向导-定界,第3/6步”对话框

图2-22 “文本导入向导-定界,第4/6步”对话框
(6)弹出“文本导入向导-第5/6步”对话框,如图2-23所示。上一步已将前两列赋给第一个变量V1,中间一列赋给第二个变量V2,后面两列赋给第三个变量V3。单击“下一步”按钮进入下一步。
(7)弹出“文本导入向导-第6/6步”对话框,如图2-24所示。单击“完成”按钮即成功读入固定格式的文本文件内容。
(8)SPSS顺利读入数据后,用户需要在变量视图中重新定义变量名,并进行宽度、小数位数等设置。

图2-23 “文本导入向导-第5/6步”对话框

图2-24 “文本导入向导-第6/6步”对话框