开源无线网络-OSRAN

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 324|回复: 0
打印 上一主题 下一主题

无线AI的思考(挑战篇)[1]

[复制链接]

42

主题

42

帖子

140

积分

注册会员

Rank: 2

积分
140
跳转到指定楼层
楼主
发表于 2023-6-23 12:14:53 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
作者:黄华
AI在无线网络中的应用落地,看到机会的同时,更多的是面临很多挑战,只有清晰认识这些挑战,并探索性找到解决办法,无线AI才能一步步成长壮大。
1 边界和范围不清晰
AI技术是否适配无线通信所有的地方呢?有什么原则?这次无线大数据华为闭门研讨会上,这个问题被广泛讨论。教授们主要的意见如下:
西南交大范平志教授:人工智能的增益主要来源于大数据,有大数据才有增益。部分通信领域采用人工智能代价太高,同时不可解释性,不一定适用人工智能,要界定清楚。
中科大徐正元教授:要区分哪些场景适合用AI解决,哪些不合适。
北大焦秉立教授:信息论发展到现在,经过几十年科学家的努力,很多通信问题有了最优解,而且算法并不复杂的,这种场景下不一定用AI。对比传统算法,AI开始不一定能够领先,但可能会越来越好。
西安交大任品毅教授:目前无线AI只有A没有I。只是基于大数据的拟合,泛化效果比较差。应付异常和随机性不好。而无线空口却存在大量的随机问题。如何在机理上要形成突破,比如自动发现新的维度,解决随机性问题等。
上大徐树公教授:无线AI不只是DL,其实传统AI算法是能够解释的,而DL的泛化能力比较强。所以无线系统中,可以采用“传统AI算法+DL”,这样就可以比较好解决可解释问题,以及泛化问题。
上面讨论的问题确实经典的AI适用范围的讨论,比如 3*7=21 这种确定性的计算,数学非常简单,如果采用NN来做,很可能结果是 21.001,不一定有优势。
关于AI在无线的适用范围, 实际上我们也一直在摸索。在应用层、管理面、控制面的应用,已经不存在太多的争议,只是收益和代价的权衡,以及平台能力、产品架构和网络架构是否能够很好支撑AI应用的问题。在用户面上,尤其是无线的RTT传输上的AI应用还存在比较多的争议,或者存在较大挑战,而这一块却又是目前学术研究最关注的领域,有大量的研究在开展。
我个人认为:无线AI应用作为新的技术和新事物,在目前这个阶段定义边界和范围其实不是特别必要,也不成熟。暂时不说“No”,因为有资格说No的专家和管理者可能并没有做过AI,也不真正懂AI,所以可以通过跟学术界2-3年的研究后再逐渐形成行业共识,没有必要匆匆下结论。
2 数据挑战
数据的挑战一直是人工智能的关键挑战,涉及的环节很多,包括数据获取、数据处理、数据安全、数据归属问题等,我争取逐个进行分析。
2.1 数据获取挑战
在这次闭门会议上,教授抱怨最多的就是数据获取困难,求助华为和中国移动。中国移动表明数据获取的成本很高,而且因为数据隐私和安全问题,数据开放也很困难。

无线系统可以自己产生数据和自己接收数据,实际上很多数据打标签并不难,这个是跟图像识别和语音识别不同的。但因为无线通信的数据维度非常高,数据类型跨度非常大,数据量也非常大(比如无线空口每1ms都会产生大量的数据),如何收集数据,收集什么数据是一个非常大的挑战。同时,收集数据也是一个系统的工程,需要体现在整个业务的流程中去,这个也是缺失的。
到运营商现网收集数据非常困难,需要各种审批,需要产品升级版本打点,使得系统能够按要求输出数据。收集的数据还很难带离现场,有信息安全和隐私保护的问题。而且如果算法设计开始没有考虑成熟(AI算法本身就是需要迭代修正的),数据收集可能还要折腾几次。更何况这种方法只能收集有限站点的数据,这种有限场景的数据训练出来的算法的泛化性是个挑战。关键的是很可能每个Case都需要这样从头到尾折腾一次,代价非常高。如果都这么搞,AI算法的代价太高,跟传统算法比可能就没有优势了。加上基于这些数据训练出来的模型现网场景化适配性不高,也就是泛化能力存在挑战,这也是为什么很多专家对AI比较悲观的原因。

我们尝试通过仿真工具产生数据,后来发现这是很不现实的。就如任品毅老师说的,AI是通过大数据去拟合出模型,基于仿真平台产生的数据,最终就只能拟合出仿真所用的公式。泛化能力和场景适应能力很差,远远不够,实际使用还需要进行场景化适应。很难训练出一个鲁棒的模型。

如何构建一个安全、多场景、低成本收集实际环境数据的平台是一个非常重要考虑的问题。如何保证AI算法的泛化能力,降低AI算法的成本也是需要重要考虑的。
2.2 数据处理挑战
无线的基站会产生大量的数据,甚至每个TTI都会有海量的数据产生。而且在无线环境下因为有时域、码域、空域、频域及功率控制、信道衰弱、干扰等因素,使得无线空口的数据维度特别多,数据特别复杂,初步估计就有40多个维度,这么复杂的数据,各种维度相互影响和耦合使得数据处理的本身就是一个非常大的挑战,如何构建结构化的数据,如何进行数据工程化,比如数据归一、清洗、保存和上传?如何标签自动化?
另外,数据也不是越多越好。在海量的数据里面如何找到高价值的数据,比如异常数据,也是非常大的挑战。

2.3 数据安全和隐私挑战
AI的基础就是大数据,但在当今的政策和经济环境下,数据安全和隐私问题越来越突出。尤其是欧盟的GDPR(一般数据保护条例)已经于2018年5月25日生效。近期曝出Facebook将因为数据泄露丑闻面临天量罚款的新闻,更使得数据应用厂家噤若寒蝉,很多应用都关闭了在欧盟范围内的使用。GDPR实际上只是一个开始,它代表了整个社会对信息和数据滥用的反思和焦虑,它必然会影响其他国家和地区关于数据安全和隐私的政策和法规。甚至可能成为反全球化运动的一个重要组成因素。
无线AI应用,都依赖收集大量的数据。如果数据安全和隐私这么敏感,那么这些数据的安全等级是不是一样的?哪些敏感一些?哪些不太敏感?要上报多少数据,怎么上报数据,什么途径上报数据?怎么证明你的数据是安全的?数据是不是上报的越多越好?数据如何脱敏?这些都是非常突出的问题了。
数据安全和隐私的策略是决定无线AI应用的根本,这点不解决好,无线AI技术的应用范围就会非常局限,很多AI解决方案构想都会是浮在沙地上的城堡。
2.4 数据产权归属问题
还有一个关键问题是数据资产归属问题。无线网络里面产生的数据是归属运营商还是设备商?如果有边界,那么哪些数据归属运营商,哪些数据归属设备商?
波音公司拥有波音飞机的数据,并且提供昂贵的数据服务。丰田汽车也收集丰田汽车的数据,并给客户更好的服务。西门子、博世等公司也都一样,在提供硬件设备的同时,也收集自己生产的硬件设备的数据。那么通信设备商是否也能够采用这种商业模式呢? 这样设备商就能够真正做到跨运营商提供更好的数据服务。将来怎么跟我司的公有云战略匹配起来呢?
当然不寻求拥有数据,通过数据训练出模型也可以支撑起很多AI应用,但终究是有些局限性了。谷歌等公司为了解决数据隐私和安全问题,现在已经趋于在端侧只上传模型,不上传数据了。
数据资产归属问题现在还是一个模糊地带,可能涉及法律法规、标准化等问题,如何明确,在哪里解决,暂时是不清晰的。



回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|OpenXG  

Copyright © 2001-2013 Comsenz Inc.Template by Comsenz Inc.All Rights Reserved.

Powered by Discuz!X3.2

快速回复 返回顶部 返回列表