新冠肺炎疫情仍在全球各地迅速蔓延,死亡人数不断攀升。这场全球性灾难对全世界的经济、政治、文化将产生深远的影响。在控制疫情的同时,我们也需要反思如何才能防止今后类似的灾难再次发生。
事实上,早在2019年12月31日,加拿大人工智能健康监测平台BlueDot,就向其客户发出了第一条有关疫情的警告。这早于世界卫生组织(2020年1月9日)和美国疾控中心(2020年1月6日)发布疫情警告的时间。
之所以BlueDot能早于世界各大卫生组织发布疫情预警,正是因为BlueDot应用人工智能技术、自然语言处理以及网络爬虫技术不间断地收集、分析世界各地关于疾病和重大公共卫生事件的报告和评论,高效地从海量的数据中提取出关键的数据,并智能地判断全球疫情大暴发的可能性。
但准确预测疫情并非一件易事,这包括海量数据的收集和处理、针对有效信息的筛癣虚假信息的自动剔除等。若是靠人为地处理这些数据,不仅效率低下,而且很难保证信息的有效和及时,尤其是在疫情的初期,仅有一些琐碎的有效信息夹杂在各式各样的信息“噪音”之中的情况下,更是如此。
所幸,人工智能技术正是处理海量数据的能手。人工智能技术让计算机在某个领域拥有一定的学习能力,并能将学习到的知识应用到真实的场景中,辅助人类做决策。
人工智能技术预测疫情表现不俗
早在2015年,英国伦敦大学学院的研究员就尝试结合人工智能与互联网信息(例如Twitter信息与评论)对大流行病的传播进行了有效的预测。该科研成果发表在了2015年的Scientific Reports。此后,伦敦大学学院的科学家们通过继续收集不同的互联网数据(例如搜索引擎指数),大大提高了人工智能模型对疫情的蔓延预测的准确度。
在预测疫情趋势方面,基于疫情高危人群相关数据,结合疫情新增确诊、疑似、 死亡、治愈病例数,借助传播动力学模型、动态感染模型、 回归模型等大数据分析模型和实践技术,人工智能技术不仅可以展示发病热力分布和密切接触者的风险热力分布,还可以进行疫情峰值拐点等大态势研判。
在预测疫情传播和追根溯源方面,利用深度学习等新兴人工智能技术,联合出行轨迹流动信息、社交信息、消费数据、暴露接触史等大量数据进行科学建模,可以根据病患确诊顺序和密切接触人员等信息定位时空碰撞点,进而推算出疾病传播路径,为传染病溯源分析提供理论依据。
这与传统的疫情传播预警系统大相径庭。传统系统绘制病毒的潜在传播情况并向有关部门发出警报,可能需要数周时间,而政府有时会在几周或几个月后才公布数据。
现在,由于人工智能和大数据已经彻底改变了传染病暴发路径的追踪和预测方法,实时预测和提前预警已成为可能。
通过使用互联性越来越强、移动化的世界所生成的信息,比如从搜索关键字数据频率,人们点击维基百科页面的位置等各种信息等,用深度学习等人工智能技术结合云端处理技术就可以实现海量的数据挖掘。
BlueDot正是应用了人工智能技术,对海量的文本数据进行分析和筛选,才能快速准确地预测到这次新冠病毒导致的疫情。
使用自然语言处理和机器学习算法来查看卫生组织的声明、商业航班、牲畜健康报告、卫星气候数据和新闻报道,不仅可以预测流行病的开始,还可以预测它将如何传播。
基于人工智能的快速疫情预测为这场疫情战争分夺秒,大大提高了抗疫措施的时效性,让防疫措施有的放矢。
现阶段AI疫情预测还需人工干预
然而,现阶段人工智能在疫情预测的过程中还需要一定程度的人工干预,需要人们更深入地研究不同的疫情案例。
受限于目前人工智能技术,疫情预测系统极易被触发、被忽略,同时系统还可能生成大量的假阳性结果。
正如开发BlueDot的公司“HealthMap”的创办人,约翰布朗斯坦所说,“数据会基于人们在网上的行为不断变化,所以你必须不断重新调整你的算法”。
同样BlueDot的疫情预测系统也需要包括地理信息系统、空间分析、计算机科学,临床传染并旅游和热带医学以及公共卫生方面的医学专家来审查人工智能标记的信息。
相信随着人工智能的不断发展和算力的不断提升,更泛化的人工智能,或基于数据自适应的算法实现也将会变成可能。
使用人工智能技术做疫情预测还在一定程度上依赖于数据的质量和可得性。比如一旦疫情为人所知,政府开始禁止地区或者国家间的人员流动,旅行模式就发生了变化。继续使用航空公司的历史数据来用人工智能作为预测将会降低模型的准确性。
而使用人工智能处理智能设备的实时地理数据,可以更好地分析疫情的聚散和传播轨迹。
以色列政府采用反恐级别的技术监控来追踪疫情,通过严密监控人们的智能手机和面部摄像头以及体温报告,可以快速识别病毒携带者并提醒与感染者的距离。不过在重视数据隐私的西方国家,这种数据的可得性将会限制并影响人工智能技术的表现。
人工智能预测疫情尚有提升空间
虽然人工智能在疫情传播预测中发挥了重大作用,但从这次疫情发展过程来看,人工智能仍有很大空间值得挖掘和提升。
目前公开渠道获取的疫情数据口径、数据统计时间等维度不统一、数据源混杂重复、数据质量不高,为人工智能处理分析带来很大困难,极大地影响了预测系统的稳健性与准确性。
并且各厂商之间的人工智能预测模型所需的数据流通不足,不同的预测系统之间的数据是分散割裂,进而数据的价值、人工智能的模型不能得到最大化的利用。这些都是人工智能技术用于预测疫情所急需解决的问题。
利用AI技术,我们将不仅可以准确地预测类似本次新型冠状病毒的疫情,还可以在疫情控制、病情诊断、疫苗研发,以及社会经济等方面帮助我们轻松战胜未来可能发生的其他疫情。
就像石油在第二次第三次工业革命中的作用一样,人工智能技术在第四次工业革命起到了至关重要的作用。相信,在未来面对疫情时,有了人工智能的助力,我们将可以从容应对,不再恐慌。