首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 网站开发 > PHP >

用 PHP 读取文件的准确方法

2013-10-14 
用 PHP 读取文件的正确方法让我们算一算有多少种方法处理诸如 PHP 之类的现代编程语言的乐趣之一就是有大

用 PHP 读取文件的正确方法

让我们算一算有多少种方法

处理诸如 PHP 之类的现代编程语言的乐趣之一就是有大量的选项可用。PHP 可以轻松地赢得 Perl 的座右铭“There's more than one way to do it”(并非只有一种方法可做这件事),尤其是在文件处理上。但是在这么多可用的选项中,哪一种是完成作业的最佳工具?当然,实际答案取决于解析文件的目标,因此值得花时间探究所有选项。

?

回页首

传统的 fopen 方法

fopen?方法可能是以前的 C 和 C++ 程序员最熟悉的,因为如果您使用过这些语言,那么它们或多或少都是您已掌握多年的工具。对于这些方法中的任何一种,通过使用?fopen(用于读取数据的函数)的标准方法打开文件,然后使用?fclose?关闭文件,如清单 1 所示。


清单 1. 用 fgets 打开并读取文件

fopen

fopen?函数将创建与文件的连接。我之所以说“创建连接”,是因为除了打开文件之外,fopen?还可以打开一个 URL:

feof

feof?命令将检测您是否已经读到文件的末尾并返回 True 或 False。清单 1?中的循环将继续执行,直至您达到文件“myfile”的末尾。注:如果读取的是 URL 并且套接字由于不再有任何数据可以读取而超时,则?feof?也将返回 False。

fclose

向前跳至清单 1 的末尾,fclose?将实现与?fopen?相反的功能:它将关闭指向文件或 URL 的连接。执行此函数后,您将不再能够从文件或套接字中读取任何信息。

fgets

在清单 1 中回跳几行,您就到达了文件处理的核心:实际读取文件。fgets?函数是处理第一个示例的首选武器。它将从文件中提取一行数据并将其作为字符串返回。在那之后,您可以打印或者以别的方式处理数据。清单 1 中的示例将精细地打印整个文件。

如果决定限制处理数据块的大小,您可以将一个参数添加到?fgets?中限制最大行长度。例如,使用以下代码将行长度限制为 80 个字符:

fread

fgets?函数是多个文件读取函数中惟一一个可用的。它是一个更常用的函数,因为逐行解析通常会有意义。事实上,几个其他函数也可以提供类似功能。但是,您并非总是需要逐行解析。

这时就需要使用?freadfread?函数与?fgets?的处理目标略有不同:它趋于从二进制文件(即,并非主要包含人类可阅读的文本的文件)中读取信息。由于“行”的概念与二进制文件无关(逻辑数据结构通常都不是由新行终止),因此您必须指定需要读入的字节数。

使用二进制数据

注意:此函数的示例已经使用了略微不同于?fopen?的参数。当处理二进制数据时,始终要记得将?b?选项包含在?fopen?中。如果跳过这一点,Microsoft? Windows? 系统可能无法正确处理文件,因为它们将以不同的方式处理新行。如果处理的是 Linux? 系统(或其他某个 UNIX? 变种),则这可能看似没什么关系。但即使不是针对 Windows 开发的,这样做也将获得良好的跨平台可维护性,并且也是应当遵循的一个好习惯。

以上代码将读取 4,096 字节 (4 KB) 的数据。注:不管指定多少字节,fread?都不会读取超过 8,192 个字节 (8 KB)。

假定文件大小不超过 8 KB,则以下代码应当能将整个文件读入一个字符串。

fscanf

回到字符串处理,fscanf?同样遵循传统的 C 文件库函数。如果您不熟悉它,则?fscanf?将把字段数据从文件读入变量中。

fgetss

fgetss?函数不同于传统文件函数并使您能更好地了解 PHP 的力量。该函数的功能类似于?fgets?函数,但将去掉发现的任何 HTML 或 PHP 标记,只留下纯文本。查看如下所示的 HTML 文件。


清单 2. 样例 HTML 文件

fpassthru 函数

无论怎样读取文件,您都可以使用?fpassthru?将其余数据转储到标准输出通道。

非线性文件处理:跳跃访问

当然,以上函数只允许顺序读取文件。更复杂的文件可能要求您来回跳转到文件的不同部分。这时就用得着?fseek?了。

?

回页首

提取整个文件

现在,我们将接触到一些 PHP 的更独特的文件处理功能:用一两行处理大块数据。例如,如何提取文件并在 Web 页面上显示其全部内容?好的,您看到了?fgets?使用循环的示例。但是如何能够使此过程变得更简单?用?fgetcontents?会使过程超级简单,该方法将把整个文件放入一个字符串中。

?

回页首

最佳实践

绝不要假定程序中的一切都将按计划运行。例如,如果您要查找的文件已被移动该当如何?如果权限已被改变而无法读取其内容又当如何?您可以通过使用?file_exists?和?is_readable?预先检查这些问题。


清单 7. 使用 file_exists 和 is_readable

?

回页首

由您来选择

PHP 不缺读取和解析文件的有效方法。诸如?fread?之类的典型函数可能在大多数时候都是最佳的选择,或者当?readfile?刚好能满足任务需要时,您可能会发现自己更为?readfile?的简单所吸引。它实际上取决于所要完成的操作。

如果要处理大量数据,fscanf?将能证明自己的价值并比使用?file?附带?split?和?sprintf?命令更有效率。相反,如果要回显只做了少许修改的大量文本,则使用?filefile_get_contents?或?readfile?可能更合适。使用 PHP 进行缓存或者创建权宜的代理服务器时可能就属于这种情况。

PHP 给您提供了大量处理文件的工具。深入了解这些工具并了解哪些工具最适合于要处理的项目。您已拥有很多的选择,因此好好地利用它们享受使用 PHP 处理文件的乐趣。

?

http://www.ibm.com/developerworks/cn/opensource/os-php-readfiles/index.html

?

热点排行