免费阅读
返回
菜单
上一章查看最新章节下一章

第三千一百零八章 统一码大会

作品:重生之乘风而起作者:二子从周
如果本章错误,请点击报错10秒纠正

讲代表,却是麦小苗。

用周至的话说,自己搞出来瀚文大字库,只代表着过去,而麦小苗基于瀚文大字库上搞出来的搜索引擎,以及驱动引擎的非线性匹配算法,才真正代表着未来。

麦小苗演讲的题目叫做《汉语在未来信息世界里的重要性》。

“作为最古老的象形文字,汉语有一项对于信息技术来讲最神奇的特性,那就是它的单位信息量。”

“以《联合国宪章》为例,中文版的《联合国宪章》有26650个字符,而英文版则需要55600个字符,在排版统一的情况下,中文文件的厚度一般只有英文等字母形语言的一半。”

“因此作为书面文字,汉字是这个星球上最高效,信息密度最高的文字。”

“究其根本原因,是因为字母形文字是‘一维’的,只代表了声音,而汉字是二维的,不仅仅代表声音,还封装了海量的信息。”

“这种信息还可以自由组合,用极简的方式完成派生词的产生。”

“比如国际化这个词,用英文表述需要二十个字符,用中文只需要三个字符,换成信息技术的表述,英文需要二十比特,而中文只需要六比特。”

“根据香农信息熵的研究,字符的信息熵为4比特,而汉字的信息熵为9.65比特,也就是说,在以计算机技术为主的信息世界里,中文可以比其余文字,以更小容量的信息载体,更快的速度,记录和传播更大的信息量。”

“比如中文的舅舅一词,只有四个比特,而要用英文来准确瞄准,则需要以‘妈妈的哥哥’来表示,中文词汇在这里还包含了血缘,辈分,性别三个维度的信息量,这是声音记录类字符型文字所无法表达的。”

“除了记录的效率,还有读取的效率。”麦小苗在台上侃侃而谈:“中国有个成语叫做‘一目十行’,意思就是中文信息的读取可以是面积式的,图形化的。”

“四叶草实验室做过一个有趣的实验,那就是将固定中文词汇的排列顺序予以打乱,然后制作出文本交给读者阅读,读者们可以惊奇地发现,混乱的词汇语序搭配正确的中文语法,并不会对阅读理解造成任何影响。”

“也就是说,‘实验’和‘验实’在文章里的作用是一样的,错误的排序会被中文使用者在下意识层面完成自动纠正。”

“人类的大脑在阅读时主要涉及两条通路,一条叫背侧通路,主要进行语音识别,一条叫腹侧通路,主要进行视觉处理和语意连接。”

…。。
   本章没完,请点击下—页继续阅读!如果被转码了请退出转码或者更换浏揽器即可。
  温馨提示:亲爱的读者,如果你觉得本站还好,为了避免丢失和转马,请勿依赖搜索访问,建议你使用[华为刘揽器]或[Firefox火狐刘揽器]访问并收蔵【二零小说】 m.20012001.net。我们将会持续为你更新,还建议你注册会员使用书架功能追书阅读更方便。
上一页 123下一页
上一章查看最新章节下一章
临时书架加入书签回顶部↑

看了《重生之乘风而起》的书友还喜欢看

穿书七零,错嫁反派被娇宠
作者:竹苑青青
简介: 【先婚后爱+反派大佬+创业养萌娃+追妻火葬场】许清柠穿成了年代文里未婚先孕的炮灰女配...
更新时间:2026-03-04 20:44:03
最新章节:第254章 到底谁是女主?
儒道至上?我在异界背唐诗!
作者:张亦安
简介: 汉语言专业大学生词宋穿越异界,来到了一个儒道之上的奇特世界,在这里,只有文人才能掌控...
更新时间:2026-03-04 21:13:28
最新章节:第 1876 章 帝子危
矜娇厌厌
作者:不吃胡萝卜的兔老大
简介: 她是秦江珩娇养的花,消失三年后再见,本该人生有路各分东西,可却被他强搂进怀里。
更新时间:2026-03-04 21:13:54
最新章节:第95章 摩天轮
狱医
作者:破空
简介: 三年前,他为女友怒而伤人,因故意伤人锒铛入狱。三年后归来,家遇变故,大哥大嫂车祸罹难...
更新时间:2026-03-04 20:40:47
最新章节:第1493章 他真是自己父亲吗?
怨我五年无所出,嫁你叔父我生一窝
作者:凯蒂
简介: 【先婚后爱+打脸虐渣+双洁+年上+甜宠+追妻火葬场】

除夕...
更新时间:2026-03-04 11:46:34
最新章节:端阳宴
七零福宝凶又猛,冻死雪夜成团宠
作者:七月妖
简介: 爸妈救人牺牲,抚恤金和房子却被爷奶叔伯霸占吃绝户。

为斩草...
更新时间:2026-03-04 21:27:48
最新章节:第一卷 第169章 神兽召唤!奶包一语惊动山林之王!
书名:

本站若有图片广告属于第三方接入,非本站所为,广告内容与本站无关,不代表本站立场,请谨慎阅读。

Copyright © 2020 二零小说 All Rights Reserved.kk

SiteMap