代码拉取完成,页面将自动刷新
同步操作将从 海风之家/SimilarCharactor 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
对常用的6700个汉字进行音、形比较,输出一个相近字的列表。
Character文件是汉字总列表
Dict存放了四角码、相似音和结构字典
WriteNum是爬取和输出笔画数字典的爬虫
writenumDict是笔画数字典
Symbol_Structure是爬取结构代码的爬虫
JudgeSimilarity根据字形和音加权计算相似度输出相近字,是主函数
TransChar2Img将汉字转化为图片并保存
ProcessWithCV2将汉字图片进行对比,近似度超过阈值则写入文件
————————————————————————附件——————————————
四角编码字典7000字是标准四角码,为4位
四角编码字典70000字是带有辅码,为5位
结构字典中,1为左右结构,2为上下结构,3为左中右结构,4为上中下结构,5为全包围结构
笔画数字典为汉字的总笔画数。
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。