2022年,国家标准《信息技术中文编码字符集》(GB 18030-2022)和金融行业标准《金融服务生僻字处理指南》(JR/T 0253-2022)发布,强化标准在生僻字处理方面的基础性和引领性作用,提高金融业信息系统生僻字解决能力,推动弥合金融业生僻字“数字鸿沟”,向生僻字群众提供便捷有温度的金融服务。本文简述金融业生僻字问题起源,分析金融业生僻字问题业务表现和形成原因,对金融机构生僻字治理工作提出思路和建议。
早期,以汉字为载体的文字材料主要通过人工书写或印刷方式来进行传播,对于不常见、不认识的汉字通称为生僻字(也叫冷僻字)。近代,随着科学技术发展和信息技术的普遍应用,为实现中文图形字符(本文主要指汉字字符)在计算机、终端、网络中的使用,需要为汉字字符设置对应的编码、字形、输入码,并进行数字化处理。当前无法有效进行数字化处理的汉字通称为生僻字。金融机构在开展金融业务时所面临的生僻字主要是指在输入、显示、打印、存储、交换等过程中出现人无法识读或计算机无法正常处理的汉字。
目前,金融业生僻字问题的业务表现主要有五方面。一是用户姓名录入与显示失败。如柜员使用通用输入法无法录入生僻字,身份证识别仪读取用户姓名时显示“?”或空白,或者用户在手机银行或网银系统中录入姓名时提示非法字符等。二是用户身份核验失败。如用户无法通过身份联网核查业务,没办法提供与身份证姓名一致的实名手机号,或者在第三方支付业务绑卡过程中无法匹配姓名等。三是汉字字形相同编码不同。用户在输入姓名时,从字形上看与身份证相符,但因实际编码不同,系统识别为不同的汉字。四是跨机构交易失败。用户在已完成生僻字改造的商业银行可以开立实名账户并开展本行业务,但是交易对手机构因没有生僻字解决能力无法接收和处理正常业务报文,如转账交易的接收行将生僻字转换成“?”或空白。五是非实名制账户强制升级。随着断卡行动的逐步推进,原通过拆字、拼音方式开立账户的生僻字客群,没办法使用原有的非实名制银行卡,且部分商业银行不具备生僻字解决能力,使得这部分用户无法接着使用原有的金融服务。
以上金融业生僻字问题业务表现,总结分析原因见下。一是部分汉字没有对应的输入码和字形。没有输入码则没办法使用输入法录入汉字,没有字形则无法显示和打印汉字,如“⿰王莹”(ying2)编码2C386、“⿰韦华”(wei3)编码2E9F5等,虽然有汉字编码,但是没有输入码,只可以通过拆字、拼音等方式处理。二是部分汉字有多个编码而混淆(也叫一字多码)。汉字编码工作是循序渐进的过程,部分汉字在拥有正式码前,会普遍的使用PUA(Private Use Area用户自定义区)编码,这些汉字后期被收录国家标准后,由于PUA编码未能完全不再使用,这时就出现一个汉字存在多个编码的情况,在系统互联时若不对编码进行特殊兼容性处理,将不能匹配为同一个汉字。如“⿱龙天”(yan3),PUA编码为E863,正式码为4DAE。三是部分汉字PUA编码不公开。从2004年开始,为解决公民姓名中存在冷僻字造成计算机系统无法录入的问题,公安部人口信息专用字库中增加了这部分汉字的编码(经常简称为人口信息PUA编码)。这部分汉字已在人口信息系统和公民身份证制证系统中普遍的使用,但其PUA编码不对外公开。四是历史信息系统功能限制。金融信息系统建设经历了较长时间,期间系统架构、硬件环境、软件版本多次迭代升级,不同阶段的系统对生僻字的支持受限。如大型主机只支持单字节和双字节的EBCDIC编码,以及因GBK限制前端采用\u4e00-\u9fa5小字符集的校验等。
近年来,在中国人民银行科技司和全国金融标准化技术委员会秘书处的推动下,金融业生僻字治理工作有序开展。国有大型商业银行和股份制商业银行已陆续完成和正在开展生僻字治理。为推进金融机构生僻字治理工作,提出以下措施,供各金融机构借鉴。
1.对标达标,提升对生僻字用户服务水平。《金融服务生僻字处理指南》(JR/T 0253—2022)行业标准和《银行营业网点生僻字客户服务指南》(T/BFIA 017—2022)团体标准是当前金融机构生僻字治理的实践总结,内容涉及生僻字输入、显示、打印、信息交换、存储等。金融机构可组织人员学习以上标准,制定生僻字处理的企业标准,提升相应岗位人员对生僻字用户的服务能力。
依据以上标准,可加强柜员培训和增设生僻字处理专员。一是加强网点柜员生僻字处理培训,每个网点至少配备一名可处理生僻字业务的柜员,可以有明显效果地处理用户姓名显示为空、问号,或没办法通过输入法正常录入用户姓名等常见生僻字问题。二是设立本机构的生僻字远程处理专员,了解生僻字有关问题产生原理,掌握生僻字问题处理方法,为本机构一线员工处理生僻字工作提供指导。
同样依据以上标准,优化生僻字业务处理流程。针对生僻字用户更好的提供人工核验和多人决策审批。如针对无法通过联网核查进行身份核验的用户,增加人工线下审核,对没办法提供实名制手机号的用户,在情况核验真实后允许绑定该用户实际在用的非本人实名手机号。
2.排查改造,升级系统对生僻字的解决能力。首先,组织排查生僻字治理现状。一是梳理本机构信息系统字符编码集使用现状,了解操作系统、数据库、业务系统等对编码的支持情况。二是统计本机构涉及生僻字的用户数量,如采用拆字、拼音等替代方式开户的存量用户数,制定适宜本机构的生僻字改造工作优先级。其次,开展信息系统编码兼容性改造。一是提供统一的编码转换工具组件,系统采用符合国家标准18030要求的字符编码集,对于不支持的系统,通过伪码方式来进行兼容处理(如采用[U+2C386]表示“王莹”)。二是升级改造身份证识别仪等终端设备,不在终端进行编码强制转换和校验,向应用系统转发原始编码,在后端进行统一处理。
最后,推进输入输出设备改造升级。一是提供统一的生僻字本地输入法或云端输入法,提升柜面、自助设备、手机银行等录入体验。二是采购生僻字字库,解决显示为空或□方框问题,打印机通过升级硬字库或软字库的方式支持生僻字打印。
3.共建生态,用好生僻字治理社会资源。从生僻字问题所集中的金融场景可见,如开立金融账户时无法通过联网核查、必须要提供实名的手机号、支付业务绑卡失败等,生僻字问题的解决不是一朝一夕,也不是单一机构可完全解决的问题,金融机构需共建生僻字治理生态,以开放包容、互利合作的方式开展金融业生僻字治理工作。一是用好金融业生僻字信息平台(),实现信息和资源共享。二是发挥由北京金融科技产业联盟孵化、中信银行捐赠的金融业生僻字处理开源项目价值,降低业务系统改造难度,持续推动生僻字治理开源生态建设,促进生僻字问题的最终解决。
随着金融业生僻字治理工作持续深入,生僻字用户的金融服务体验得到一定改善,但生僻字“数字鸿沟”的完全解决需要相关行业监管部门、社团组织、金融机构、产业机构间协同合作,共同打造一个良好的生僻字治理工作生态环境。
1.发挥标准的引领作用,完善客户服务与规章。一是加强标准宣贯实施工作,发挥国家标准18030引领作用,提升公众对标准的认知。二是以金融业生僻字处理指南为基础,适时开展生僻字处理国家标准编制,实现汉字处理的标准化和统一化。三是各机构应根据生僻字问题对实际业务的影响,及时完善审核流程和制定生僻字客户服务手册,为一线生僻字服务人员提供指导,不以不符合制度为由对生僻字用户服务进行推诿。
2.开展对标达标公示行动,建立公益性生僻字工具集。一是优选经济发达地区开展生僻字治理工作试点,组织机构按照标准开展对标达标行动,有效落实标准关键技术指标,循序推进信息系统升级改造。二是依托金融业生僻字信息平台,开展标准符合性声明公示和自查检测,将自查和检验测试结构在平台上公示。三是建立金融业在用生僻字汉字集库,明晰处理解决方案,统一各机构业务处理方式。
3.鼓励PUA编码有序退出,加强跨行业统筹协调。一是对一字两码或一字多码的汉字,提供PUA编码与正式码对照关系,组织PUA编码有序退出和存量数据的转换工作。二是对仅有PUA编码的汉字,尽快进行国家标准编码收录工作,并做好过渡期的兼容工作。三是加强行业间生僻字治理工作统筹协调,建立主管单位间的协作、共享机制,成立治理专项工作组,定期召开协调会议,通报治理进度及分享治理经验。四是聚焦群众反映强烈、影响日常生活的民生服务,如身份联网核查、手机号实名验证等问题,优先开展系统间协同改造。
2022金融街论坛年会成方金融科技论坛上,中国人民银行副行长潘功胜表示,“服务门槛高、覆盖面不足、‘数字鸿沟’难以消除是普惠金融发展面临的世界性、长期性难题”。生僻字治理工作具有其自身复杂性,是数字化的经济时代的社会难题,需要各机构和各行业协同合作,着眼数字中国建设,摒弃部门行业利益,从根本上解决生僻字“数字鸿沟”。