【DTalk专访】交通大学宋利:选择与协同,AI未来的十字路口
AI会取代哪些人类能力?有哪些是人类的“保留优势”,我们应该把精力投入在哪里?企业呢?
AI技术进步是否会带来社会分化?我们能否用AI促成更多公平?
创业、教育、医疗、艺术——哪些领域最需要“AI人类协同”?如何协同?
如果AI是工具,那我们对“人”的定义是否也要重塑?
顾青:从技术研发者的视角,您认为在推动AI创新的同时,应如何通过技术设计本身来规避伦理风险(例如保障人类核心能力不被削弱)?能否结合图像通信或网络工程领域的案例说明?
宋利:
技术的一个大的方向称为超级对齐(Super alignment),包括和人类价值观对齐的训练、确保训练数据无毒无偏、开放程度受控等。具体的例子是:DeepFake可以换脸,数字人现在可以做到只用一张照片和几秒钟的声音,生成一个人的说话和动作视频,这就需要相应的ID身份保护机制或鉴别算法进行保护。
顾青:人机协同的底层逻辑“您认为未来AI与人类协同的‘共生关系’需要哪些技术或机制支撑?例如在图像处理、通信工程等具体场景中,如何设计系统才能既发挥AI的高效性,又保留人类在创造力、伦理判断上的不可替代性?
宋利:
人机协同,以人为主,AI为助手或帮手。这个是主流的看法或态度。技术而言,规则性的,重复性的都是AI可直接替代的部分,而创意、创新的部分需要被解耦出来;通过提示词工程或者强化学习之类加持后训练的方式,是当下人机协作的主流路劲,大有可为;举个例子:我们团队与ChinaDaliy合作,通过学习他们御用美工师的Style,帮助他们进行配图生成,典型的用法是帮助提供创意初稿或要求不太高的版面,帮助提升生产率。
顾青: 教育体系的适应性变革“您提到AI可能导致某些领域人类能力的退化,尤其在教育和医疗领域。从高校科研与人才培养的角度,上海交大是否已开展相关学科改革?例如如何重构课程体系,确保学生既能掌握AI工具,又保有核心专业能力的深度发展?
宋利:
确实如此。这波GenAI对教育、医疗和律师等原来看上去很专业知识要求非常高的行业也产生了不小的冲击。可汗学院创始人最近有本新书《教育新语》,专门讨论了人工智能时代教什么,怎么学的话题。
上海交大已经全面推动AI赋能教学和科研,今年学期初在全国高校率先部署上线了满血版本的DeepSeek,为全校师生提供服务,数字人教师也陆续进入老师们的线上教程,各种与AI教学有关的专题研讨会每周都有,相信不久就能看到很多优秀的案例和成效。
顾青:您曾将编码比作『技术与艺术的结合』,在AIGC时代,当AI能创作视觉内容,工程师的『艺术直觉』是否会被算法取代?人类创造力在技术链条中如何重新定位?
宋利:
AIGC的前生是PGC和UGC,按照进化的逻辑,AIGC是走向更Diversity的,或者我们可以叫人-机协作的xGC;Tech和Art的双向流动和结合非常重要,可以产生更多的可能性,就像绘画艺术一样,有古典现实主义,有印象派,有超现实主义,有抽象派等,时间拉长,AIGC有可能产生出新的流派和主义,当然早期也会带来混乱和不适,也需要我们人类转换视角,用新的认知来对待“生成”这件事。
举个例子:同样是《泉》,杜尚和安格尔可谓大相径庭,但都是艺术的杰出代表,或许AIGC创作的“泉”,可以既非具象(像安格尔的写实主义)也非抽象(杜尚的符号主义),而是新的方式,比如多模态的一个3D或视频.
顾青:您对‘AI取代人类工作’这一命题持技术乐观还是审慎态度?如果未来AI在您的专业领域(如通信工程)实现全流程自动化,您认为哪些人类角色的价值会被强化而非削弱?能否给出一个具体的技术演进时间表预测?
宋利:
此话题被讨论很多次,这个表述的准确说法是:AI肯定会替代部分人类当前的工作;AI赋能通信已经是进行时,正在进行中的6G主要就是AI的深度嵌入,这个是挑战也是新的机会,我算是谨慎的乐观主义。
按照OpenAI的说法,L1-L5,目前我们处在L3级别,即智能体,之后的两级是创新者和组织者。他们的这个逻辑是按照人类社会的方式在类比,从超级个体到超级组织。
关于那些职业最容易被取代,那些活得久,这个很多场合和大佬们都做过阐述;我想说另外一个重要的方面:迷惘的一代(lost generation),这个在欧美日等发达国家的不同时期(二战至今)都有过,放在当下AI Age,不单是工作被取代,甚至会产生无意义感,混杂着焦虑和无聊。
因此,不只是要用AI降本增效,这个过程很快会完成,更重要的是需要“创造需求”,挖掘新的精神或服务层面的,产生价值的精神需求(审美,健康和体验类的服务),更多小的毛细血管,社区形态的工作,并且加强社会普惠福利的建设。我觉着未来20年这个事更迫切,至于AGI或ASI等时间表的说法,我觉着介于科学与伪科学之间,既难以证真也难以证伪,且听且看,我乐于做个旁观者。

本文嘉宾宋利教授,博士生导师, 上海交通大学图像通信与网络工程研究所副所长,中国视频用户体验联盟副秘书长及标准组组长。研究方向是AI媒体生成、处理与通信。主持国家级科研项目 10 余项,发表学术论文 300 余篇,授权发明专利 50 项,国际标准贡献 10 余项,软件著作权 5 项。获国家科技进步二等奖(2015)、 上海市科技进步一等奖(2011)、上海市技术发明一等奖(2011)、上海产学研合作优秀项目奖(2024)、日本大川基金研究奖 (2013)、国际会议优秀论文奖(VCIP2024,ISCAS 2022, VCIP2016, WCSP2010)、国际竞赛奖(ICME 2017, 2020)、 腾讯云最具价值专家 TVP、声网最具价值专家 MVP,IEEE 高级会员、世界超高清产业联盟、MPEG China、中国智慧家庭产业联盟、中国视谷、科创中国未来网络等联盟和团体的技术专家,创建知名技术公众号“媒矿工厂”。

