云计算、AI、云原生、大数据等一站式技术学习平台

网站首页 > 教程文章 正文

ScalersTalk 成长会 Python 小组第 9 周学习笔记

jxf315 2025-05-28 18:08:13 教程文章 6 ℃

Scalers 点评:在 2015 年,ScalersTalk 成长会完成 Python 小组完成了 《Python 核心编程》第 1 轮的学习。到 2016 年,我们开始第二轮的学习,并 且将重点放在章节的习题上。Python 小组是成长会内部小组,如果你想和我们 一起学习 Python,你需要是成长会成员,并且完成相关进群任务。

我们的节奏是行动是一周一章学到位,章节习题都会一个一个过。通过到位地 执行,达到实质性的提升。

本周学习情况

本周(20160314-20160320)学习第九章,章节内容为《文件》。本周复盘主 持人为 张丹荔。

本章主要内容

本章介绍了文件对象(内建函数、内建方法、属性), 标准文件, 访问文件系统的方法, 文件执行,初步认识持久存储和标准库中与文件有关的模块.

本章主要知识点

文件对象

  • 定义:连续的字节序列,通常使用流的方式传输,流可以是单个字节也可以是大数据块。

  • 文件及类文件:普通的磁盘文件, 而且也可以访问任何其它类型抽象层面上的”文件”,例如通过URL访问Web页面,或者网络通讯中的Socket.

文件内建函数

  • open: 用于打开文件的内建函数

    open(filename, access_mode, buffering)

    其中 access_mode支持r,w,a,U四种模式,buffering支持-1, 0, 1, 大于1的数字


  • file: 同open函数功能相同,仅当需要通过上下文表示访问的是文件对象时,才需要考虑使用,否则一般使用open即可。

  • UNS: 通用换行符,默认Python中打开了对于通用换行符的支持,无论是哪个系统中使用的换行符,皆可以被识别,同时Python中还提供了关闭该功能的方法——即
    --without-universal-newlines
    来关闭该功能。

文件内建方法

  • 读:

    read, readline, readlines(size=-1, 0, n), next
  • 写:

    write(str), writelines(sequences)
  • 位移:

    seek(offset, whence=0,1,2), tell
  • 关闭:

    close
  • 其它:

    fileno, truncate(size), flush, isatty

文件内建属性

  • closed: 是否关闭状态

  • encoding: 编码方式

  • mode: 打开方式

  • name: 文件名称

  • newlines: 换行符信息,若还没遇到换行符时,为None;若找到一个换行符,返回结果为字符串;若找到多个换行符,为换行符的列表

标准文件

Python中只要程序一执行,就可以访问三个标准文件,分别如下:

  • sys.stdin: 标准输入(一般是键盘)

  • sys.stdout: 标准输出(到显示器的缓冲输出)

  • sys.stderr: 标准错误(到屏幕的非缓冲输出)

    我们可以通过 sys库拿到这三个文件的句柄,即可访问以上三个文件。此外,sys.*对应的所有都是文件,都可以通过句柄来访问。

命令行参数

命令行参数即在执行Python程序时,通过命令行输入的参数,类似shell等在终端执行命令时输入的参数。这里采用了类似C语言中的表示方法,即argv.

  • argc: 命令行参数的个数

    len(sys.argv)
  • argv: 命令行参数的列表

    访问方式:sys.argv,返回一个存储了所有参数的列表,其中首个元素sys.argv[0]是程序的名称,从sys.argv[1]才开始表示输入的第一个参数,若输入只有一个参数时,推荐直接使用sys.argv[1]来获取第一个参数;若输入参数较多时,推荐使用getopt库获取命令行参数列表。

文件系统

  • 访问方式:通过 os 模块来访问

  • os模块对于文件及文件夹的操作:

    • 操作单个文件:

      mkfifo/mknod, remove/unlink, rename/renames, tmpfile, walk
    • 操作文件夹:

      chdir/fchdir, chroot, listdir, mkdir/makedirs, rmdir/removedirs
    • 调整权限:

      access, chmod, chown/lchown, umask
    • 文件描述符:

      open, read/write
  • os.path模块对于文件路径的操作:

    • 分隔:

      basename, dirname, join, ……
    • 信息:

      getatime, getctime, getmtime, getsize
    • 查询:

      exists, isabs, isdir, ……

文件持久化存储相关库

  • 序列化对象的库:

    • pickle/cPickle序列化的库:

      pickle.dump(obj, file) 序列化 pickle.load(obj) 反序列化
    • anydbm持久化存储的库:

      db = anydbm.open(filename, access_mode) //1
      db[key_str] = value_str //2
      db.close //3
      db.items //4

      通过keyvalue方式存储,仅仅支持存储字符串,即keyvalue都必须是字符串。


    • shelve库:

      结合了前两者的功能,既可以将任意Python对象序列化,同时还可以将其存储在文件或者内存中。使用方法类似anydbm

其它文件相关库

  • 编码转换:

    base64, binascii, uu
  • 压缩解压:

    gzip/zlib, bz2, tarfile, zipfile
  • 高级文件访问:

    shutil
  • 其它:

    tempfile, cStringIO

ScalersTalkID:scalerstalk

本微信公众号作者Scalers,游走在口译世界的IT从业者。微信公众号ScalersTalk,网站ScalersTalk.com,口译100小时训练计划群C 456036104

成长会是由Scalers发起的面向成长、实践行动,且凝聚了来自全球各地各行各业从业者的社群。有意入会者请和Scalers直接联系,我和其他会员会和你直接交流关于成长行动等各方面的经验教训。2016年成长会持续招募中,参见做能说会写的持续行动者:ScalersTalk成长会2016年会员计划介绍(2016.2更新)

Tags:

最近发表
标签列表