字王·汉字结构·熵·理论

字王·汉字结构·熵·理论

—汉字结构的数字化大门,量化分析之路,终于开启

前几天,blog《字王·百字工程》发布,百字工程正式启动
虽然,还只是最初期的数据整理阶段,也涌现了大量的创意idea、理论突破。
看来,任何事情,只要动起来,都会有收获。
这几天,最大的收获,就是《汉字结构·熵·理论》。
如果说,20年前的字王字库智能字模,只是一个概念,那么,《汉字结构·熵·理论》,可以说是套完整的“汉字结构”量化分析理论体系。
也许,在五千年的历史当中,我们第一次能够,对汉字结构,进行数字化的量化分析。
在信息论中,熵被用来衡量一个随机变量出现的期望值。
很自然的,熵这个物理学、热学的概念,被导入了字王的汉字结构体系。
1z,一个标准单位的汉字结构的熵,是1K(1000×1000像素)字库的1/n,(这个目前只是概念参数,日后会细化)
汉字结构的熵,单位是英文字母:z,发音“泽”。
字母:z,是zw字王拼音的缩写,也可以纪念太祖:泽东先生,汉字始祖“仓颉”;“颉”字,在南方某些地区,发音也有些类似。
根据这几天的数据整理,套用萌芽阶段的《汉字结构·熵·理论》,发现了几个有趣的现象:

[*] ::500像素版本,仿宋体最高,690z,黑体:500z,楷体:560z,新宋体/宋体:530z,雅黑:480z
[*] ::取样像素的大小,对字体””熵””值影响不大,雅黑400像素:500z,雅黑500像素:480z,雅黑1K像素:460z,
[*] ::奇怪的是,取样精度越高,””熵””值越小,理论上,所需要的“核心字”数目也越少

未来数月,随着《字王·百字工程》的逐步推进,将会发布更加完整的相关文章和报告。
目前,规划的方向有:

[*]::””熵””值、””熵””密度单位的定义与延伸
[*]::汉字笔画、单字、字库的””熵””值、””熵””密度
[*]::各种字形的””熵””值表(类似早期的对数表)
[*]::字王·工具箱字体公益软件,也会收入””熵””值计算模块
[*]::“永”字八法、“国”字结构的数学基础

ps,补充
昨晚,导入””熵””值,连夜发布了blog:《汉字结构·熵·理论》
睡了一觉,思路打开,继续喷
“”熵””值的导入,类似现代物理学原子、电子的发现,
从底层、根本上解决了汉字结构的最基本的量化单位问题,
也许,目前版本的””熵””值:定义,模型、参数、。。。,与未来,最终的数字化、汉字结构理论,天差地别,
无所谓,毕竟,汉字结构的数字化大门,量化分析之路,终于开启了。。。。。。

补充几个新的思路

[*]::””熵””密度,””熵””值与汉字“黑”像素的比率
[*]::统一的””熵””值,为不同汉字字体的结构分析,奠定了基础
[*]::基于””熵””值的

发表评论

电子邮件地址不会被公开。 必填项已用*标注