问:中国当局不近人情的动态清零措施,受到越来越多的批评,惟网监全力封杀相关言论,令民怨、真相难透过网络曝光。但有网友成功透过粤语发文回避当局的言论审查,是怎样的一回事?umf免费翻墙网
李建军:在语言学上,由于粤语语法与中文书面语有相当大的差异,因此原本设计用于审查书面中文言论的人工智能系统,无法有效学习有关内容,所以粤语短片、帖文避过了机器审查的法眼。而在人工操作上,又由于很多审查员根本不懂粤语,因此未能察觉粤语撰写的帖文内容敏感,无从下手进行审查,使粤语的内容再成功闯关。umf免费翻墙网
另外在技术上还有一个突围关键,就是由于历史原因,令粤语和普通话采用了不同的电脑汉字字符集。umf免费翻墙网
现时很多粤用字,其实都是香港政府在主权移交前,英国政府为推广政府和法院使用电脑通讯和存档而编入香港政府字集之中,由于香港传统上用繁体字,当时在电脑编码时就理所当然跟随同样使用繁体字的台湾,而非使用简化汉字的大陆,因此,在Unicode未普及前,其实是台湾繁体电脑编码Big-5的延伸部分。umf免费翻墙网
很多中国政府程式都是主力处理中国大陆的字集编码,一般用Unicode来处理文字,一般都不会特意处理Big-5码内容,更何况是由Big-5伸延的香港政府字集。而且过去由于大陆流行的输入法,一般都不处理繁体字和香港字,而编写电脑程式的习惯,并非在一时三刻可以改变,因此,技术上, 大陆的一套系统,理论上不具备使用粤语发表文章的能力,故当局原本也无必要刻意开发针对粤语输入的审查系统。umf免费翻墙网
但现代作业系统技术上的进步,就明显改变了情况。苹果Mac OS、iOS等,除了有手写输入法,更可以语音输入,而大陆流行的输入法,亦改到可以输入日文、韩文、繁体字等汉字,应付商务往来上的需要,于是乎就再不难直接用粤语发表内容,而由于中国当局审查系统未赶得及提升,当局是依赖人手去审查内容,因此当出现粤语发文批评政府的内容,其生存时间往往比较长,令到相关资讯能得以传递。umf免费翻墙网
问:用粤语发表文章没那么容易受到审查的优势能保持多久?umf免费翻墙网
李建军:毕竟中国当局一直都处心积虑过滤香港的互联网内容,因此,肯定有暗中投放资源去设计可以处理香港字集内容的审查工具,以及利用人工智慧去了解粤语的语法内容并作出审查。因此,一旦中共能在香港实施大规模网络审查,粤语突围发敏感讯息的优势就会随之消失,因为届时中国当局可以利用这套系统,同时应用于广东以及澳门等粤语地区。umf免费翻墙网
问:那么使用其他地方语言,譬如闽南语、客家话,又能否同样达到避过审查的功效?umf免费翻墙网
李建军:粤语是比较幸运,因为英国政府当年为了纪录可能含有大量粗言秽语的刑事案件供词,因此花费大量人力物力和时间,在古籍中归纳了不少粤语甚至只见于口语的写法,但其他中国方言,一般都未有做这类的整理,或投放资源在类似的研究上。因此,除非有人为其他省份的语言研究出一套公认的写法,并且像香港政府字集一样被编入Unicode中,否则其他语言很难像粤语一样意外获得「翻墙」能力。要其它中文方言获取「翻墙」能力,不但需要投放大量资源去研究,还要在中国、日本、韩国等主权国家在商讨Unicode修订时,愿意将有关新字交予Unicode标准制订者,并具能于手机和电脑上输入。而以现时的政治局势,恐怕不易有空间去向Unicode相关组织提交新的字。因此,暂时其他中国地区的语言要作为回避封锁的工具,难度远比粤语为高。暂时有可能只有粤语具备这种能力,除非其他语言使用急起直追。umf免费翻墙网