没多少人知道的生僻字(几乎没人知道的生僻字)
为了让大家晚上早点睡觉,差评君没有琢磨打字技巧。——为了打字更快,差评君还学会了双拼打字。
但是写了这么久的文章,差评君也发现了一些打字不能快速解决的问题:比如打一个电脑里根本不存在的单词。
上面这个词可能有些穷朋友很熟悉,也可能有些穷朋友不知道。在bing ——「 bing bing面条」中发音为bing。
饿了,想吃东西
但由于bing这个词只是用来表示这种著名的陕西面食,使用量太少,太生僻,导致电脑的字符码集迟迟没有收录,所以这个词在电脑里打不出来。
不过最近网上突然有消息称,Unicode已经将bing纳入CJK统一表意汉字扩展G区,从今天开始生效。
那我现在可以在电脑里打bing了吗?陕西的朋友可以在微信上教别人写bingbing面吗?
让我们冷静下来,朋友们。不是这样的,因为电脑里的文字编码和输入法不一样。
换句话说,你在电脑里看到的东西,未必是输入法打出来的。
但是,要想搞清楚这件事,差评师必须先和大家说说电脑里的单词编码。
众所周知,现代计算机是美国人制造的。为了方便处理文字,他们为计算机中的26个字母制定了一套编码标准。
简单来说,相当于指定计算机中第一个字符是“A”,第二个字符是“B”。
只有这个一号和二号是二进制的“0100 0001”。
这就是著名的asker (ASCII)码——,也被称为美国信息交换标准码。当时的ASCII码表不亚于现在的99乘法表,是计算机处理文字的基础。
但是ASCII码有个问题:由于当时硬盘很小,有1 MB就不错了,所以整个ASCII表只能定义256个字符。
所以当计算机漂洋过海,进入其他国家的时候,那些不会说英语的朋友很愤怒,—— ASCII表根本没有为其他语言预留足够的空间。
如果我们还在使用ASCII表,我们可以在计算机中使用汉字。(许多常用字符将会丢失)
有一段时间,各国都开始制定自己的书写标准,比如西欧的ISO-8859系列标准,微软的Windows-12xx系列标准。
以及我们的中文GB 2312字符编码标准。
虽然大家自己制定的一些字符编码标准解决了不同语言在电脑中的存储问题,但是在一个品牌的电脑中可以正常显示的文档,运行到其他电脑上往往会变成乱码。
这就好比之前没有USB充电口,功能机和山寨机各用各种各样的充电头,谁也不兼容谁。
所以,就像充电宝上插着各种插头的万用线一样,电脑上的排版软件要集成尽可能多的文字编码规范,才能自动识别文档的文字编码,正确显示字符。
然而,总是使用通用电缆并不是一个好主意。要是每个人都用同一根USB线就好了。
于是在80年代,在微软、苹果、Adobe、惠普、IBM等几大科技巨头的主导下建立了Unicode。
过去,ASCII码苦于序列位数不足,只能存储256个字。所以这个通用码直接把序号拉到16位。
如果将所有字符从“0000 0000 0000 0000”塞进“1111 1111 1111 1111”,则可存储65,536个单词。
这还不是全部。后来Unicode把字符编码扩展到32位,40多亿字的存储空间,更不用说全世界的字符了,以后发现外星文明的时候可能还是够用的。
手头宽裕了,做事自然会大方得多:20年来,Unicode不仅收集了世界上所有的主要文字,还收集了所有的古文字和象形文字。
《康熙字典》和《四库全书》在列
我们通常使用的Emoji表情也是Unicode字符编码的一部分:
Unicode内部还有一个特殊的小组,负责和表达式设计者讨论下次应该添加什么表达式。
所包含的东西都是好的、完整的,操作系统和文字排版工具自然不需要和文字编码竞争。反正选择Unicode编码是对的。
这一次,包含bing字符的Unicode 13实际上是Unicode标准的第13版更新3354。除了比昂字,它还包含了4939个生僻字。
反正没人知道
(这一段没有Bug)
其实差评君在这一段的左上角给大家抄了一个bing字,但是现在你看到的可能只是一个黑色背景上的“嘴”或者一个大大的问号。
嗯,虽然从现在开始Unicode 13标准正式发布了,但是我们还不能马上用。
这是因为字符代码是内置在操作系统中的,所以今天只是意味着厂商可以开始集成了,距离我们正式体验还有一段系统更新的距离。
什么时候你更新系统后发现上面的bing字可以正常显示?
,就代表着操作系统已经更新到最新的 13.0 版 Unicode 文字编码了。不过即使是这样,这个 biáng 字依旧是「 只可远观,但打不出来 」。
因为在我们的拼音规范里没有 biáng 的拼音,权威字典里也没有收录这个字。
实际上, biáng 是一个由 bi ( 读 bai )和 áng 两个音节组合而成的合音,属于关中地区的方言发音,不能单独作为一个拼音来使用,所以无法被拼音输入法打出来。
而 biáng 字的性质也和「 招财进宝 」类似,属于民间为了这个发音生造出来的一种臆造字( 野字 )。
而且 biáng 字本身更是在陕西的不同地区存在差异较大的不同写法,把谁收录进字典估计其他地区的朋友都不会同意,所以干脆不费这劲,让它继续野着去了。
孔乙己,你知道 biáng 有几种写法吗?▼
所以即使以后电脑里可以正常显示 biáng 字了,我们也依旧没法通过拼音输入法正常把它打出来,只能跑到百科一类的地方复制粘贴。
不过今年的时候,也有陕西民俗学家在推动 biáng 字进字典的事宜了,有 Unicode 的示例在前,说不定等再过几年这件事也许还真能迎来个大反转。
估计到时候我们就能正常的用 biáng 打出这个字了。
相关问答:
下一篇:印钞厂在中国哪里