用 PHP 读取文件的正确方法
让我们算一算有多少种方法
处理诸如 PHP 之类的现代编程语言的乐趣之一就是有大量的选项可用。PHP 可以轻松地赢得 Perl 的座右铭“There's more than one way to do it”(并非只有一种方法可做这件事),尤其是在文件处理上。但是在这么多可用的选项中,哪一种是完成作业的最佳工具?当然,实际答案取决于解析文件的目标,因此值得花时间探究所有选项。
?回页首
传统的 fopen 方法
fopen
?方法可能是以前的 C 和 C++ 程序员最熟悉的,因为如果您使用过这些语言,那么它们或多或少都是您已掌握多年的工具。对于这些方法中的任何一种,通过使用?fopen
(用于读取数据的函数)的标准方法打开文件,然后使用?fclose
?关闭文件,如清单 1 所示。
清单 1. 用 fgets 打开并读取文件
fopen
fopen
?函数将创建与文件的连接。我之所以说“创建连接”,是因为除了打开文件之外,fopen
?还可以打开一个 URL:feof
feof
?命令将检测您是否已经读到文件的末尾并返回 True 或 False。清单 1?中的循环将继续执行,直至您达到文件“myfile”的末尾。注:如果读取的是 URL 并且套接字由于不再有任何数据可以读取而超时,则?feof
?也将返回 False。fclose
向前跳至清单 1 的末尾,
fclose
?将实现与?fopen
?相反的功能:它将关闭指向文件或 URL 的连接。执行此函数后,您将不再能够从文件或套接字中读取任何信息。fgets
在清单 1 中回跳几行,您就到达了文件处理的核心:实际读取文件。
fgets
?函数是处理第一个示例的首选武器。它将从文件中提取一行数据并将其作为字符串返回。在那之后,您可以打印或者以别的方式处理数据。清单 1 中的示例将精细地打印整个文件。如果决定限制处理数据块的大小,您可以将一个参数添加到?
fgets
?中限制最大行长度。例如,使用以下代码将行长度限制为 80 个字符:fread
fgets
?函数是多个文件读取函数中惟一一个可用的。它是一个更常用的函数,因为逐行解析通常会有意义。事实上,几个其他函数也可以提供类似功能。但是,您并非总是需要逐行解析。这时就需要使用?
fread
。fread
?函数与?fgets
?的处理目标略有不同:它趋于从二进制文件(即,并非主要包含人类可阅读的文本的文件)中读取信息。由于“行”的概念与二进制文件无关(逻辑数据结构通常都不是由新行终止),因此您必须指定需要读入的字节数。使用二进制数据
注意:此函数的示例已经使用了略微不同于?
fopen
?的参数。当处理二进制数据时,始终要记得将?b
?选项包含在?fopen
?中。如果跳过这一点,Microsoft? Windows? 系统可能无法正确处理文件,因为它们将以不同的方式处理新行。如果处理的是 Linux? 系统(或其他某个 UNIX? 变种),则这可能看似没什么关系。但即使不是针对 Windows 开发的,这样做也将获得良好的跨平台可维护性,并且也是应当遵循的一个好习惯。以上代码将读取 4,096 字节 (4 KB) 的数据。注:不管指定多少字节,
fread
?都不会读取超过 8,192 个字节 (8 KB)。假定文件大小不超过 8 KB,则以下代码应当能将整个文件读入一个字符串。
fscanf回到字符串处理,
fscanf
?同样遵循传统的 C 文件库函数。如果您不熟悉它,则?fscanf
?将把字段数据从文件读入变量中。fgetss
fgetss
?函数不同于传统文件函数并使您能更好地了解 PHP 的力量。该函数的功能类似于?fgets
?函数,但将去掉发现的任何 HTML 或 PHP 标记,只留下纯文本。查看如下所示的 HTML 文件。
清单 2. 样例 HTML 文件fpassthru 函数无论怎样读取文件,您都可以使用?
fpassthru
?将其余数据转储到标准输出通道。非线性文件处理:跳跃访问当然,以上函数只允许顺序读取文件。更复杂的文件可能要求您来回跳转到文件的不同部分。这时就用得着?
fseek
?了。?回页首
提取整个文件
现在,我们将接触到一些 PHP 的更独特的文件处理功能:用一两行处理大块数据。例如,如何提取文件并在 Web 页面上显示其全部内容?好的,您看到了?
fgets
?使用循环的示例。但是如何能够使此过程变得更简单?用?fgetcontents
?会使过程超级简单,该方法将把整个文件放入一个字符串中。?回页首
最佳实践
绝不要假定程序中的一切都将按计划运行。例如,如果您要查找的文件已被移动该当如何?如果权限已被改变而无法读取其内容又当如何?您可以通过使用?
file_exists
?和?is_readable
?预先检查这些问题。
清单 7. 使用 file_exists 和 is_readable?回页首
由您来选择
PHP 不缺读取和解析文件的有效方法。诸如?
fread
?之类的典型函数可能在大多数时候都是最佳的选择,或者当?readfile
?刚好能满足任务需要时,您可能会发现自己更为?readfile
?的简单所吸引。它实际上取决于所要完成的操作。如果要处理大量数据,
fscanf
?将能证明自己的价值并比使用?file
?附带?split
?和?sprintf
?命令更有效率。相反,如果要回显只做了少许修改的大量文本,则使用?file
、file_get_contents
?或?readfile
?可能更合适。使用 PHP 进行缓存或者创建权宜的代理服务器时可能就属于这种情况。PHP 给您提供了大量处理文件的工具。深入了解这些工具并了解哪些工具最适合于要处理的项目。您已拥有很多的选择,因此好好地利用它们享受使用 PHP 处理文件的乐趣。
?
http://www.ibm.com/developerworks/cn/opensource/os-php-readfiles/index.html
?