scipy.io.

loadmat#

scipy.io.loadmat(file_name, mdict=None, appendmat=True, **kwargs)[source]#

加载 MATLAB 文件。

参数:
file_namestr

mat 文件的名称(如果 appendmat==True,则不需要 .mat 扩展名)。也可以传递打开的文件类对象。

mdictdict, optional

要插入 matfile 变量的字典。

appendmatbool, optional

如果给定的文件名没有 .mat 扩展名,则设置为 True 以将 .mat 扩展名追加到给定文件名的末尾。默认值为 True。

byte_orderstr or None, optional

默认值为 None,表示从 mat 文件猜测字节顺序。否则可以是 (‘native’, ‘=’, ‘little’, ‘<’, ‘BIG’, ‘>’)。

mat_dtypebool, optional

如果为 True,则以与加载到 MATLAB 中相同的 dtype 返回数组(而不是保存它们的 dtype)。

squeeze_mebool, optional

是否压缩单位矩阵维度。

chars_as_stringsbool, optional

是否将字符数组转换为字符串数组。

matlab_compatiblebool, optional

以 MATLAB 加载矩阵的方式返回矩阵(表示 squeeze_me=False,chars_as_strings=False,mat_dtype=True,struct_as_record=True)。

struct_as_recordbool, optional

是否将 MATLAB 结构体加载为 NumPy 记录数组,还是作为旧式 NumPy 数组,dtype=object。将此标志设置为 False 会复制 scipy 版本 0.7.x 的行为(返回 NumPy 对象数组)。默认设置为 True,因为它允许更容易地对 MATLAB 文件进行双向加载和保存。

verify_compressed_data_integritybool, optional

是否应该检查 MATLAB 文件中压缩序列的长度,以确保它们不会比我们预期的更长。建议启用此选项(默认值),因为 MATLAB 文件中过长的压缩序列通常表示文件已发生某种损坏。

variable_namesNone or sequence

如果为 None(默认值) - 读取文件中的所有变量。否则,variable_names 应该是一个字符串序列,给出要从文件中读取的 MATLAB 变量的名称。读取器将跳过任何名称不在此序列中的变量,可能会节省一些读取处理。

simplify_cellsFalse, optional

如果为 True,则返回一个简化的字典结构(如果 mat 文件包含单元格数组,这将很有用)。请注意,这只会影响结果的结构,而不是其内容(两种输出结构的内容相同)。如果为 True,则会自动将 struct_as_record 设置为 False,并将 squeeze_me 设置为 True,这是简化单元格所必需的。

返回:
mat_dictdict

以变量名称为键,加载的矩阵为值的字典。

备注

支持 v4(级别 1.0)、v6 和 v7 到 7.2 的 mat 文件。

您将需要一个 HDF5 Python 库来读取 MATLAB 7.3 格式的 mat 文件。由于 SciPy 没有提供一个,因此我们在这里没有实现 HDF5/7.3 接口。

示例

>>> from os.path import dirname, join as pjoin
>>> import scipy.io as sio

从 tests/data 目录获取示例 .mat 文件的文件名。

>>> data_dir = pjoin(dirname(sio.__file__), 'matlab', 'tests', 'data')
>>> mat_fname = pjoin(data_dir, 'testdouble_7.4_GLNX86.mat')

加载 .mat 文件内容。

>>> mat_contents = sio.loadmat(mat_fname)

结果是一个字典,每个变量对应一个键值对

>>> sorted(mat_contents.keys())
['__globals__', '__header__', '__version__', 'testdouble']
>>> mat_contents['testdouble']
array([[0.        , 0.78539816, 1.57079633, 2.35619449, 3.14159265,
        3.92699082, 4.71238898, 5.49778714, 6.28318531]])

默认情况下,SciPy 将 MATLAB 结构体读为结构化的 NumPy 数组,其中 dtype 字段的类型为 object,名称对应于 MATLAB 结构体字段名称。可以通过设置可选参数 struct_as_record=False 来禁用此功能。

获取包含名为 teststruct 的 MATLAB 结构体的示例 .mat 文件的文件名,并加载其内容。

>>> matstruct_fname = pjoin(data_dir, 'teststruct_7.4_GLNX86.mat')
>>> matstruct_contents = sio.loadmat(matstruct_fname)
>>> teststruct = matstruct_contents['teststruct']
>>> teststruct.dtype
dtype([('stringfield', 'O'), ('doublefield', 'O'), ('complexfield', 'O')])

结构化数组的大小是 MATLAB 结构体的大小,而不是任何特定字段中的元素数量。形状默认为 2-D,除非设置可选参数 squeeze_me=True,在这种情况下,所有长度为 1 的维度都会被移除。

>>> teststruct.size
1
>>> teststruct.shape
(1, 1)

获取 MATLAB 结构体中第一个元素的 ‘stringfield’。

>>> teststruct[0, 0]['stringfield']
array(['Rats live on no evil star.'],
  dtype='<U26')

获取 ‘doublefield’ 的第一个元素。

>>> teststruct['doublefield'][0, 0]
array([[ 1.41421356,  2.71828183,  3.14159265]])

加载 MATLAB 结构体,压缩掉长度为 1 的维度,并从 ‘complexfield’ 获取项目。

>>> matstruct_squeezed = sio.loadmat(matstruct_fname, squeeze_me=True)
>>> matstruct_squeezed['teststruct'].shape
()
>>> matstruct_squeezed['teststruct']['complexfield'].shape
()
>>> matstruct_squeezed['teststruct']['complexfield'].item()
array([ 1.41421356+1.41421356j,  2.71828183+2.71828183j,
    3.14159265+3.14159265j])