借着Python-3来聊聊utf-8字符集

论坛 期权论坛 编程之家     
选择匿名的用户   2021-6-2 17:56   1991   0

关于文本文件

  文本文件也是以二进制序列的方式保存在磁盘中的,磁盘并不能保存文本;我们打开文本文件的时候之所以能看到文字,是因为

  软件根据文件所用编码的字符集对文件进行解码的原因。

以utf-8字符集为例

  字符集就是一种编码规则,如字母'a'在磁盘中是以 01100001 这个二进制串的形式保存;事实上生活中也有字符集这样的规则存在

  比如600036这个号码对于“股民”来说这个就是“招商银行”;有点跑题了,回到重点上来,字符集就是一种编码规则。

  utf-8自然也是一套编码规则啦,股票代码的长度是相对固定的,而utf-8编码后的二进制串的长度是不固定的;

---

分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:3875789
帖子:775174
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP