12-I/O
I/O模块
文件模块
路径模块
进程和组长
iodata和chardata
本章简单介绍Elixir的输入、输出机制以及相关的模块, 如IO, 文件 和路径。
现在介绍I/O似乎有点早,但是I/O系统可以让我们一窥Elixir哲学,满足我们对该语言以及VM的好奇心。
12.1-IO模块
IO模块是Elixir语言中读写标准输入、输出、标准错误、文件、设备的主要机制。 使用该模块的方法颇为直接:
iex> IO.puts "hello world"
"hello world"
:ok
iex> IO.gets "yes or no? "
yes or no? yes
"yes\n"
IO模块中的函数默认使用标准输入输出。
我们也可以传递:stderr
来指示将错误信息写到标准错误设备上:
iex> IO.puts :stderr, "hello world"
"hello world"
:ok
12.2-文件模块
文件模块包含了可以让我们读写文件的函数。
默认情况下文件是以二进制模式打开,它要求程序员使用特殊的IO.binread/2
和IO.binwrite/2
函数来读写文件:
iex> {:ok, file} = File.open "hello", [:write]
{:ok, #PID<0.47.0>}
iex> IO.binwrite file, "world"
:ok
iex> File.close file
:ok
iex> File.read "hello"
{:ok, "world"}
文件可以使用:utf8
编码打开,然后就可以被IO模块中其他函数使用了:
iex> {:ok, file} = File.open "another", [:write, :utf8]
{:ok, #PID<0.48.0>}
除了打开、读写文件的函数,文件模块还有许多函数来操作文件系统。
这些函数根据Unix功能相对应的命令命名。
如File.rm/1
用来删除文件;File.mkdir/1
用来创建目录;File.mkdir_p/1
创建目录并保证其父目录一并创建;
还有File.cp_r/2
和File.rm_rf/2
用来递归地复制和删除整个目录。
你还会注意到文件模块中,一般函数都有一个名称类似的版本。区别是名称上一个有!(bang)一个没有。 例如,上面的例子我们在读取“hello”文件时,用的是不带!号的版本。 下面用例子演示下它们的区别:
iex> File.read "hello"
{:ok, "world"}
iex> File.read! "hello"
"world"
iex> File.read "unknown"
{:error, :enoent}
iex> File.read! "unknown"
** (File.Error) could not read file unknown: no such file or directory
注意看,当文件不存在时,带!号的版本会报错。就是说不带!号的版本能照顾到模式匹配出来的不同情况。 但有的时候,你就是希望文件在那儿,!使得它能报出有意义的错误。
因此,不要写:
{:ok, body} = File.read(file)
相反地,应该这么写:
case File.read(file) do
{:ok, body} -> # handle ok
{:error, r} -> # handle error
end
或者
File.read!(file)
12.3-路径模块
文件模块中绝大多数函数都以路径作为参数。通常这些路径都是二进制,可以被路径模块提供的函数操作:
iex> Path.join("foo", "bar")
"foo/bar"
iex> Path.expand("~/hello")
"/Users/jose/hello"
有了以上介绍的几个模块和函数,我们已经能对文件系统进行基本的IO操作。 下面将讨论I/O模块中令人好奇的高级话题。这部分不是写Elixir程序必须掌握的,可以跳过不看。 但是如果你大概地浏览一下,可以了解IO是如何在VM上实现以及其它一些有趣的内容。
12.4-进程和组长
你可能已经发现,File.open/2
函数返回了一个包含PID的元祖:
iex> {:ok, file} = File.open "hello", [:write]
{:ok, #PID<0.47.0>}
I/O模块实际上是同进程协同工作的。当你调用IO.write(pid, binary)
时,
I/O模块将发送一条消息给执行操作的进程。
让我们用自己的代码表述下这个过程:
iex> pid = spawn fn ->
...> receive do: (msg -> IO.inspect msg)
...> end
#PID<0.57.0>
iex> IO.write(pid, "hello")
{:io_request, #PID<0.41.0>, #PID<0.57.0>, {:put_chars, :unicode, "hello"}}
** (ErlangError) erlang error: :terminated
调用IO.write/2
之后,可以看见打印出了发给IO模块的请求。
然而因为我们没有提供某些东西,这个请求失败了。
StringIO模块 提供了一个基于字符串的IO实现:
iex> {:ok, pid} = StringIO.open("hello")
{:ok, #PID<0.43.0>}
iex> IO.read(pid, 2)
"he"
Erlang虚拟机用进程给I/O设备建模,允许同一个网络中的不同节点通过交换文件进程, 实现节点间的文件读写。在所有IO设备之中,有一个特殊的进程,称作组长(group leader)。
当你写东西到标准输出,实际上是发送了一条消息给组长,它把内容写给STDIO文件表述者:
iex> IO.puts :stdio, "hello"
hello
:ok
iex> IO.puts Process.group_leader, "hello"
hello
:ok
组长可为每个进程做相应配置,用于处理不同的情况。 例如,当在远程终端执行代码时,它能保证远程机器的消息可以被重定向到发起操作的终端上。
12.5-iodata和chardata
在以上所有例子中,我们都用的是二进制/字符串方式读写文件。 在“二进制、字符串和字符列表”那章里,我们注意到字符串就是普通的bytes, 而字符列表是code points(字符码)的列表。
I/O模块和文件模块中的函数接受列表作为参数。 还可以接受混合类型的列表,里面内容是整形、二进制都行:
iex> IO.puts 'hello world'
hello world
:ok
iex> IO.puts ['hello', ?\s, "world"]
hello world
:ok
尽管如此,有些地方还是要注意。一个列表可能表示一串byte,或者一串字符。 用哪一种需要看I/O设备是怎么编码的。
如果不指明编码,文件就以raw模式打开,这时候只能用文件模块里bin开头(二进制版) 的函数对其进行操作。 这些函数接受iodata*作为参数,即,它们期待一个整数值的列表,用来表示byte或二进制。
尽管只是细微的差别,如果你打算传递列表给那些函数,你需要考虑那些细节。 底层的bytes可以表示二进制,这种表示就是raw的。