当非洲农民也用中国DeepSeek 美国AI巨头错失了什么?|专栏
想像一下,在东非乌干达的一片玉米田里,一位农民正因作物歉收而愁眉不展。他打开手机,在WhatsApp上收到了一条由乌干达农业部发送的种植建议——而这条信息正是由中国大语言模型Qwen(通义千问)生成。
这个看似超现实的场景,正在成为这个东非国家土地上的常态。在拥有4800万人口的乌干达,虽然英语是官方语言,但仅有约30%的受教育人口能熟练使用,其余绝大多数人使用着40多种本土方言。
被矽谷遗忘的“低资源语言”
一家来自乌干达的非政府机构Sunbird AI自2024年起开始测试几个开源大语言模型,包括Google的Gemma、Meta的Llama和阿里巴巴的Qwen(通义千问),Sunbird AI执行总裁Ernest Mwebaze发现,尽管美国大模型在英语方面表现优越,但在面对非洲本土那些(Low-resource languages)时,其优势便荡然无存。
由于小语种语料库匮乏、商业回报率低,西方科技巨头往往不愿投入资源。相比之下,阿里的Qwen系列支持多达119种语言,覆盖了印尼的爪哇语(Javanese)、菲律宾的宿雾语(Cebuano)、海地克里奥尔语(Haitian Creole)、斯瓦希里语(Swahili)等大量被主流模型边缘化的地方语系。Sunbird AI基于Qwen打造的Sunflower模型,则将适用于当地的语言从6种一举扩展到了31种。
极致性价比:10%成本背后的普惠诱惑
成本是使用中国模型的另一个决定性因素。
根据最新市场定价,DeepSeek V3系列模型调用API的成本极低:每百万输入Token(即用于处理输入指令Token)约0.28美元,输出token约0.42美元。相比之下,与之同级别的GPT-4o百万输入token成本则高达2.5美元左右,输出则高达10美元,相当于DeepSeek V3的十到二十倍。
对于缺乏庞大资金支持的AI企业或组织而言,投入高昂成本使用西方模型根本是不现实的选择。Mwebaze表示,中国的开源模型让他们向乌干达民众提供免费的AI服务,并在各个领域进行灵活部署。目前,Sunbird AI已与乌干达政府合作,协助各政府部门推动数码减贫、进行人口普查,以及为使用不同语言的人口提供农业资讯、教育材料等,努力让那70%曾被数码经济排除在外的人群重新参与进来。
在肯尼亚,一家从事AI研发、为非洲各国政府和企业提供AI政策建议和解决方案的Qhala同样在使用中国的大语言模型。
Qhala的AI工程师Wenslous Egesa表示,尽管Open AI的顶级模型非常强大,但对一些企业来说,在选择模型时最重要的还是成本考量,尤其是当企业只是需要使用模型来“快速浏览和检查内部文件”,使用顶级模型就显得没有必要了。
谁更懂全球南方需求?
2025年7月的世界人工智能大会(WAIC)期间,中国提出最新版倡议性文件《人工智能全球治理行动计划》,试图为这个全球议题提出“中国方案”,当中就包括帮助全球南方国家真正接触和应用人工智能”、支持这些国家发展AI技术和服务。
尽管西方舆论对中国模型的数据私隐与合规性充满疑虑,但对于全球南方国家而言,实用主义胜过了一切。
全球开源社区风向标Hugging Face的最新报告显示,中国模型已占据Hugging Face月度模型下载总量的41%,首次超越美国模型。在2025年推出的新模型中,超过63%的热门微调模型是基于中国开源底座(如DeepSeek-R1或Qwen系列)开发的。
全球最大AI模型API聚合平台OpenRouter3月发布的数据则显示,自2026年2月起,中国AI模型在该平台的Token消耗量首次超过美国竞争对手,在3月16至22日这一周内,全球前10大热门模型共消耗8.7兆token,当中中国模型占比达到约61%(约5.3兆Token)。
不仅在非洲,在东南亚,马来西亚研究机构利用DeepSeek微调出了全球首个符合伊斯兰教法的AI模型“NurAI”。该模型不仅支持马来语、印尼语,更确保输出内容符合穆斯林市场的宗教与文化标准。在日本,当地企业开发的前10大模型中,有6个是基于DeepSeek和Qwen构建的。从印尼的数字身份系统到肯尼亚的斯瓦希里语医疗问答,中国技术正在渗透进这些国家的社会底层架构。
正如Mwebaze所言:“如果一位农民无法获取资讯,而这个模型能提供她能理解的准确信息,我们就会认为这是非常好的......如果你来自一个根本没有模型可用的地方,你首要的任务就是让技术先运作起来。”