【翻墙问答】粤语、繁体字避过中共网络审查 封城期间接力传递

2022.11.18
Share on WhatsApp
Share on WhatsApp
2014年4月16日,在北京,一名新浪微博员工正在电脑前工作。中国当局从其时起一再收紧网络舆论监控。近期封城期间,有网民利用粤语避过网络监控,成功发布被当局视为敏感的资讯。
法新社

问:中国当局不近人情的动态清零措施,受到越来越多的批评,惟网监全力封杀相关言论,令民怨、真相难透过网络曝光。但有网友成功透过粤语发文回避当局的言论审查,是怎样的一回事?

李建军:在语言学上,由于粤语语法与中文书面语有相当大的差异,因此原本设计用于审查书面中文言论的人工智能系统,无法有效学习有关内容,所以粤语短片、帖文避过了机器审查的法眼。而在人工操作上,又由于很多审查员根本不懂粤语,因此未能察觉粤语撰写的帖文内容敏感,无从下手进行审查,使粤语的内容再成功闯关。

另外在技术上还有一个突围关键,就是由于历史原因,令粤语和普通话采用了不同的电脑汉字字符集。

现时很多粤用字,其实都是香港政府在主权移交前,英国政府为推广政府和法院使用电脑通讯和存档而编入香港政府字集之中,由于香港传统上用繁体字,当时在电脑编码时就理所当然跟随同样使用繁体字的台湾,而非使用简化汉字的大陆,因此,在Unicode未普及前,其实是台湾繁体电脑编码Big-5的延伸部分。

很多中国政府程式都是主力处理中国大陆的字集编码,一般用Unicode来处理文字,一般都不会特意处理Big-5码内容,更何况是由Big-5伸延的香港政府字集。而且过去由于大陆流行的输入法,一般都不处理繁体字和香港字,而编写电脑程式的习惯,并非在一时三刻可以改变,因此,技术上, 大陆的一套系统,理论上不具备使用粤语发表文章的能力,故当局原本也无必要刻意开发针对粤语输入的审查系统。

但现代作业系统技术上的进步,就明显改变了情况。苹果Mac OS、iOS等,除了有手写输入法,更可以语音输入,而大陆流行的输入法,亦改到可以输入日文、韩文、繁体字等汉字,应付商务往来上的需要,于是乎就再不难直接用粤语发表内容,而由于中国当局审查系统未赶得及提升,当局是依赖人手去审查内容,因此当出现粤语发文批评政府的内容,其生存时间往往比较长,令到相关资讯能得以传递。

问:用粤语发表文章没那么容易受到审查的优势能保持多久?

李建军:毕竟中国当局一直都处心积虑过滤香港的互联网内容,因此,肯定有暗中投放资源去设计可以处理香港字集内容的审查工具,以及利用人工智慧去了解粤语的语法内容并作出审查。因此,一旦中共能在香港实施大规模网络审查,粤语突围发敏感讯息的优势就会随之消失,因为届时中国当局可以利用这套系统,同时应用于广东以及澳门等粤语地区。

问:那么使用其他地方语言,譬如闽南语、客家话,又能否同样达到避过审查的功效?

李建军:粤语是比较幸运,因为英国政府当年为了纪录可能含有大量粗言秽语的刑事案件供词,因此花费大量人力物力和时间,在古籍中归纳了不少粤语甚至只见于口语的写法,但其他中国方言,一般都未有做这类的整理,或投放资源在类似的研究上。因此,除非有人为其他省份的语言研究出一套公认的写法,并且像香港政府字集一样被编入Unicode中,否则其他语言很难像粤语一样意外获得「翻墙」能力。要其它中文方言获取「翻墙」能力,不但需要投放大量资源去研究,还要在中国、日本、韩国等主权国家在商讨Unicode修订时,愿意将有关新字交予Unicode标准制订者,并具能于手机和电脑上输入。而以现时的政治局势,恐怕不易有空间去向Unicode相关组织提交新的字。因此,暂时其他中国地区的语言要作为回避封锁的工具,难度远比粤语为高。暂时有可能只有粤语具备这种能力,除非其他语言使用急起直追。

新增评论

请将评论填写在如下表格中。 评论必须符合自由亚洲电台的 《使用条款》并经管理员通过后方能显示。因此,评论将不会在您提交后即时出现。自由亚洲电台对网友评论的内容不负任何责任。敬请各位尊重他人观点并严守事实。

评论

中共
2023/01/05 08:46

已经能识别粤语了