书名:用Python轻松处理Excel数据
ISBN:978-7-115-61451-3
本书由人民邮电出版社发行数字版。版权所有,侵权必究。
您购买的人民邮电出版社电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。
我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。
著 阳光灿烂
责任编辑 谢晓芳
人民邮电出版社出版发行 北京市丰台区成寿寺路11号
邮编 100164 电子邮件 315@ptpress.com.cn
网址 http://www.ptpress.com.cn
读者服务热线:(010)81055410
反盗版热线:(010)81055315
读者服务:
微信扫码关注【异步社区】微信公众号,回复“e61451”获取本书配套资源以及异步社区15天VIP会员卡,近千本电子书免费畅读。
本书旨在帮助读者掌握如何用Python高效地处理Excel数据,实现办公自动化。
本书首先介绍开发环境的搭建和Excel模块的安装,接着讲解编写代码前的准备,然后介绍如何使用openpyxl和pandas这两个模块编写员工信息表查询案例,最后介绍PyInstaller模块与.py文件的编译,以及如何快速移植本书案例的代码。
本书不仅适合办公人员阅读,还适合想要了解openpyxl模块和pandas模块的初级开发人员阅读。
作为一名职场文员,经常对Excel文档进行操作是否让你感到烦恼?经常复制、粘贴、查询、导出表格数据是否让你感到疲惫?
作为一名读者,你是否感觉各种教程一看就懂,一动手就不会?对于书中的案例,不知道具体在代码中如何运用,你是否有挫败感?代码运行出现问题,不知道在哪里找到答案,你是否感觉很茫然?对书中案例提及的变量,你是否感到很头痛?很难记住变量的含义是否会让你阅读比较困难?
我自己也是一名职场人士,也购买过不少计算机书,上述问题我也经常遇到。所以当我学习Python后,就萌生了一个想法:不如把我自己在学习过程中接触到的一些入门知识和编写代码时积累的经验总结并归纳出来,帮助职场非IT人士快速掌握编程入门技巧,以解决上述问题,提高工作效率。
Python在数据分析方面(尤其是Excel应用方面)的功能很强大,用Python辅助Excel处理数据的效率明显比只使用Excel处理数据高很多。
本书重点介绍Python中两个著名的Excel模块——openpyxl和pandas。这两个模块的功能非常强大,本书只介绍基础知识,力求使职场非IT人士都能看懂并能使用。
目前市场上的书通常基于语法架构介绍各个知识点。本书另辟蹊径,将openpyxl模块和pandas模块的入门知识、Python的基础知识融入一个成熟且完整的案例中,并附上大量的代码调试过程。这不但可以让读者看清楚变量的值在代码运行过程中的变化,加深其对代码的理解,而且可以让读者更容易理解openpyxl模块和pandas模块是如何运用的。
本书主要内容如下。
第1章介绍开发环境的搭建。
第2章讲述Excel模块的安装。
第3章讨论编写代码前的准备。
第4章介绍如何使用openpyxl模块编写员工信息表查询案例。
第5章介绍如何使用pandas模块编写员工信息表查询案例。
第6章讲述PyInstaller模块的安装与.py文件的编译和运行。
第7章讨论如何快速移植本书案例的代码。
附录A介绍离线安装Visual Studio Code中文包插件可能遇到的问题和解决方法。
附录B讲述离线安装pandas模块可能遇到的问题和解决方法。
附录C介绍pandas模块依赖的openpyxl模块或者xlrd模块。
附录D介绍openpyxl模块速查表。
附录E介绍pandas模块速查表。
附录F讨论关于编程的一些小技巧。
本书具有以下特点。
● 以员工信息表查询案例为主线,分别基于openpyxl和pandas这两个模块讨论代码的编写,主要目的是让读者了解这两个模块的优势和差异,以便在工作中能够灵活运用这两个模块。
● 重点对代码进行讲解,对一些知识点进行拓展,方便读者理解相关知识。
● 穿插了不少图片,目的是让读者有更直观的认识,不会因为枯燥的文字而失去阅读乐趣。
● 展示了大量的代码调试过程,有助于读者看清楚变量的值在代码运行过程中的变化,从而加深对代码的理解。
因为本书主要讲解openpyxl和pandas两个模块的一些基础知识,包括Excel表格的建立、数据的查询、数据的输入和表格的修饰,所以本书涉及的知识并不会太多、太高深。对于职场非IT人士,只需要掌握基本知识就可以提高工作效率。
本书面向的读者是常使用Excel并且想进一步提高工作效率和希望了解openpyxl与pandas两个模块的职场非IT人士。
由于本书针对同一个案例,因此在介绍代码时,代码行号会从1开始到代码结束,对应源代码.py文件的行号(例如,在介绍openpyxl模块的代码时,行号从1开始;在介绍pandas模块的代码时,行号也从1开始);在分段介绍代码时,代码行号不会重新从1开始。
本书的出版要特别感谢人民邮电出版社的刘涛、陈冀康、谢晓芳等人员,他们对本书提出了很多宝贵意见,感谢他们为我撰写本书提供帮助。
感谢简书和知乎上的一些作者,他们把自己的经验分享出来,让我在编写代码遇到问题时可以参考他们的思路,找到相应的解决方法。
上述人员为我开辟了一条平坦大道,使我少走了很多弯路,本书的成功撰写离不开他们的帮助。
由于能力有限,书中难免有不足和错漏之处,编写的代码也不是最优的,敬请广大读者谅解并提出宝贵意见。
阳光灿烂
本书由异步社区出品,社区(https://www.epubit.com)为您提供后续服务。
您还可以扫码二维码, 关注【异步社区】微信公众号,回复“e61451”直接获取,同时可以获得异步社区15天VIP会员卡,近千本电子书免费畅读。
为了方便读者学习,本书中案例对应的源代码(opnepyxl模块的源代码和pandas模块的源代码)可以在异步社区下载。
作者、译者和编辑尽最大努力来确保书中内容的准确性,但难免会存在疏漏。欢迎您将发现的问题反馈给我们,帮助我们提升图书的质量。
当您发现错误时,请登录异步社区,按书名搜索,进入本书页面,单击“发表勘误”,输入相关信息,单击“提交勘误”按钮即可,如下图所示。本书的作者和编辑会对您提交的信息进行审核,确认并接受后,您将获赠异步社区的100积分。积分可用于在异步社区兑换优惠券、样书或奖品。
我们的联系邮箱是contact@epubit.com.cn。
如果您对本书有任何疑问或建议,请您发邮件给我们,并请在邮件标题中注明本书书名,以便我们更高效地做出反馈。
如果您有兴趣出版图书、录制教学视频,或者参与图书翻译、技术审校等工作,可以发邮件给我们;有意出版图书的作者也可以到异步社区投稿(直接访问www.epubit.com/ contribute即可)。
如果您所在的学校、培训机构或企业想批量购买本书或异步社区出版的其他图书,也可以发邮件给我们。
如果您在网上发现有针对异步社区出品图书的各种形式的盗版行为,包括对图书全部或部分内容的非授权传播,请您将怀疑有侵权行为的链接通过邮件发送给我们。您的这一举动是对作者权益的保护,也是我们持续为您提供有价值的内容的动力之源。
“异步社区”是人民邮电出版社旗下IT专业图书社区,致力于出版精品IT图书和相关学习产品,为作译者提供优质出版服务。异步社区创办于2015年8月,提供大量精品IT图书和电子书,以及高品质技术文章和视频课程。更多详情请访问异步社区官网https:// www.epubit.com。
“异步图书”是由异步社区编辑团队策划出版的精品IT专业图书的品牌,依托于人民邮电出版社的计算机图书出版积累和专业编辑团队,相关图书在封面上印有异步图书的LOGO。异步图书的出版领域包括软件开发、大数据、人工智能、测试、前端、网络技术等。
异步社区
微信服务号
在编写代码之前,需要先搭建开发环境,即安装Python和Python代码编辑器Visual Studio Code。
本书所用的操作系统是Windows 10,Python和Python代码编辑器Visual Studio Code都是在Windows 10环境下安装的。
本书所用的Python版本是3.8.1,所用的代码编辑器Visual Studio Code版本是1.67.2。
Python安装包可以从Python官网免费下载。访问Python官网,将鼠标指针移至导航栏的Downloads选项上,在弹出的下拉菜单中选择All releases,如图1-1所示,进入下载页面。
图1-1 Python官网
单击下载页面中的Download Python ×××(×××代表版本号)按钮,下载最新版的Python,如图1-2所示。
图1-2 下载最新版的Python
如果想下载旧版本的Python,那么可以在下载页面的“Looking for a specific release?” 部分找到相应的版本,单击Download链接,如图 1-3 所示,跳转到旧版本Python的下载页面。
图1-3 旧版本Python的下载
在旧版本Python的下载页面下方找到对应的安装包,单击该安装包链接(例如,64位Windows操作系统可执行文件Windows x86-64 executable installer),即可下载旧版本Python的安装包,如图1-4所示。
右击Python的安装包(.exe文件),在弹出的菜单中选择“以管理员身份运行”,用管理员的身份安装Python,如图1-5所示。
图1-4 Python的安装包
图1-5 用管理员的身份安装Python
启动安装包后,在安装界面中,勾选Add Python 3.8 to PATH复选框,然后单击Install Now按钮,开始安装Python,如图1-6所示。
图1-6 对Python进行配置后安装
成功安装Python后,安装界面会显示Setup was successful,单击Close按钮,结束Python的安装,如图1-7所示。
图1-7 Python安装成功
Visual Studio Code安装包可以从其官网免费下载。访问Visual Studio Code官网,单击右上角的Download按钮,如图1-8所示,进入下载页面。
图1-8 Visual Studio Code官网
在下载页面中,选择对应的操作系统(如Windows)并单击下载按钮,下载Visual Studio Code安装包,如图1-9所示。
图1-9 下载Visual Studio Code安装包
如果想下载旧版本的Visual Studio Code,那么先单击Visual Studio Code官网导航栏的Updates按钮,然后在左侧列表中选择月份,再单击页面中间的System链接即可,如图1-10所示。
图1-10 旧版本Visual Studio Code安装包的下载
右击Visual Studio Code的安装包(.exe文件),在弹出的菜单中选择“以管理员身份运行”,用管理员的身份安装Visual Studio Code,如图1-11所示。
图1-11 用管理员的身份安装Visual Studio Code
启动安装包后,在安装界面中,选择“我同意此协议”单选按钮,然后单击“下一步”按钮,开始安装Visual Studio Code,如图1-12所示。
图1-12 Visual Studio Code安装界面
在安装过程中,根据提示单击“下一步”按钮,并确保勾选“添加到PATH(重启后生效)”复选框,如图1-13所示。
图1-13 Visual Studio Code安装配置
在准备安装界面中,单击“安装”按钮,开始安装Visual Studio Code,如图1-14所示。
图1-14 开始安装Visual Studio Code
成功安装Visual Studio Code后,单击“完成”按钮,结束Visual Studio Code的安装,如图1-15所示。
图1-15 Visual Studio Code安装成功
本书选择Visual Studio Code的原因是它可以轻松加载中文包插件,该插件用于将英文版Visual Studio Code变成中文版。对于英语不好的人来说,使用中文版的代码编辑器是非常有必要的。
在计算机能够访问互联网的情况下,我们可以在线安装Visual Studio Code插件。
Visual Studio Code中文包插件是一款将英文版Visual Studio Code变成中文版Visual Studio Code的插件。本书所用的Visual Studio Code中文包插件版本是1.67.3。
图1-16(a)和(b)展示了安装Visual Studio Code中文包插件前后菜单栏的变化。图1-16(a)所示是安装中文包插件前的菜单栏,菜单栏中的文字是英文;图1-16(b)所示是安装中文包插件后的菜单栏,菜单栏中的文字是中文。
(a)Visual Studio Code英文版菜单栏
(b)Visual Studio Code中文版菜单栏
图1-16 Visual Studio Code的菜单栏
在线安装Visual Studio Code中文包插件的方法如下。
单击左侧导航栏中有4个小方块的Extensions图标,在搜索栏中输入“chinese”,找到插件“Chinese(Simplified)(简体中文)”,单击install按钮,如图1-17所示。
成功安装中文包插件后,Visual Studio Code右下角会弹出一个提示框,提示重启Visual Studio Code,如图1-18所示。单击Restart按钮,重启Visual Studio Code,再次打开就切换为中文版的Visual Studio Code了。
图1-17 安装Visual Studio Code中文包插件
图1-18 提示重启Visual Studio Code
虽然搜索结果中显示的中文包插件的版本是1.68.6092128,如图1-19(a)所示,但是因为本书所用的Visual Studio Code版本是1.67.3,所以安装时会自动选择中文包插件版本1.67.3,如图1-19(b)所示。
(a)中文包插件的1.68.6092128版本
(b)中文包插件的1.67.3版本
图1-19 中文包插件的版本
Python插件是一款让 Visual Studio Code 运行Python代码的插件。本书所用的Python插件版本是2022.8.0。
在线安装Python插件的方法如下。
单击左侧导航栏中的Extensions图标,在搜索栏中输入“python”,找到Python插件,单击“安装”按钮,如图1-20所示。
图1-20 安装Python插件
在计算机不能访问互联网的情况下,可以离线安装Visual Studio Code插件。也就是说,先把插件安装包下载到本地计算机中,然后在本地计算机中运行插件安装包。
这里以离线安装中文包插件为例进行介绍,其他插件的离线安装方法是一样的。
离线安装Visual Studio Code插件的方法如下。
(1)访问插件市场官网。访问Visual Studio Code插件市场(visual studio marketplace)官网,单击Visual Studio Code,在搜索栏中输入插件名称“chinese”,单击用于搜索的放大镜按钮,如图1-21所示,跳转到插件列表页面。
图1-21 Visual Studio Code插件市场官网
(2)选择插件。在插件列表页面中,选择插件“Chinese(Simplified)(简体中文)”,如图1-22所示,跳转到下载页面。
图1-22 Visual Studio Code中文包插件
(3)下载插件。在中文包插件下载页面的右侧有一个Download Extension链接,单击该链接,下载vsix格式的离线安装包,如图1-23所示。
图1-23 中文包插件下载链接
(4)安装插件。在Visual Studio Code中,单击左侧导航栏中的“扩展”图标,单击右上方的 (视图和更多操作)图标,如图1-24(a)所示。在弹出的菜单中,选择“从VSIX安装”,如图1-24(b)所示,选择刚才下载的vsix格式的离线安装包即可。
(a)单击“视图和更多操作”图标
(b)选择“从VSIX安装”
图1-24 安装插件
安装好Python、Visual Studio Code和相关插件后,我们尝试新建并运行第一个.py文件,看看开发环境是否搭建成功。
先新建一个文本文档,将其命名为Hello World,如图1-25(a)所示。然后,打开这个文本文档,输入print('Hello World'),如图1-25(b)所示,并保存这个文本文档。
(a)新建Hello World文本文档
(b)输入代码
图1-25 新建文本文档并输入代码
将这个文本文档的扩展名.txt修改为.py,可以看见文件类型从“文本文档”变成“Python 源文件”,如图1-26所示。
用Visual Studio Code打开Hello World.py文件,可以看见输入的代码,如图1-27所示。
图1-26 修改扩展名
图1-27 打开Hello World.py文件
在Visual Studio Code的菜单栏中,选择“运行”→“启动调试”,如图1-28(a)所示,在上方弹出的debug configuration下拉列表框中,选择Python File,如图1-28(b)所示。
(a)选择“启动调试”
(b)选择Python File
图1-28 调试
在Visual Studio Code的终端界面中,我们可以看见输出的文字“Hello World”,如图1-29所示,这说明开发环境搭建成功。
图1-29 成功运行第一个.py文件
读者服务:
微信扫码关注【异步社区】微信公众号,回复“e61451”获取本书配套资源以及异步社区15天VIP会员卡,近千本电子书免费畅读。