【转载】代码自动生成—路遥 vs 马力(北京大学 李戈)



  • 本文转载自:https://mp.weixin.qq.com/s/QRpC6mheM11KxBh8vOGjug。

    本文编发了北京大学李戈老师在NASAC 2018数据驱动的智能化软件开发论坛(论坛网站:http://bigcode.fudan.edu.cn/events/NASAC2018Forum/) 上所做的报告“代码自动生成—路遥 vs 马力”。

    报告内容

    本报告对“程序代码自动生成”的困难进行了探讨。指出“从编程者意图生成程序代码”的问题,可以看做是“程序员意图空间”到“程序代码空间”的映射。对这一映射关系的学习较“图像识别”、“自然语言翻译”具有更高的学习难度。报告对困难的原因给出了一种直观的解释:“图像识别”可以看做是“从一个边界清晰的连续数据集合到一个边界较清晰的准连续数据集合的映射”;“自然语言翻译”可以看做是“两个边界较清晰的准连续数据集合之间的映射”;而“程序自动生成”可以看做是“从一个边界不清晰的准连续需求意图集合,到一个边界不清晰的离散的目标程序集合的映射”,这种映射难以用连续函数映射来表达,从而给现有数据学习方法的应用带来了困难。

    报告指出“将学习空间压缩至一个数据足够密集的子领域”以提高数据集合的连续性和数据边界的清晰性,是降低这一困难的可能途径。在报告的最后,对新一代智能编程工具aiXcoder的功能和效果进行了演示并欢迎大家参加工具测试。

    0_1543755378262_e378534a-cd9d-442b-b3d8-919fdd3ce94e-image.png

    0_1543755385467_cf745fef-0d31-404c-b4e9-351638cfa85a-image.png

    0_1543755396159_7c3e9440-e145-4021-b331-14d834c9df4f-image.png

    0_1543755412217_058582a8-a6d5-4f09-8c43-f0ddf1ad6b9f-image.png

    0_1543755418326_7b9711e5-9056-4f43-a4ac-98d24868e858-image.png

    0_1543755424921_3dcd9c42-e018-4716-90dc-b99988bd1a6f-image.png

    0_1543755431275_21826296-f1b2-4515-85ba-9a32dcee3e43-image.png

    0_1543755437797_37dac31f-0e54-4eea-93b5-ff3482d699fc-image.png

    0_1543755445141_c1a0c738-2ad8-4620-98d7-689a2117b357-image.png

    0_1543755457794_383bfe9b-9764-4fe6-a7cc-7eafd5be5c74-image.png

    0_1543755464208_48c12574-24c1-4066-b401-5fac5ce3c30d-image.png

    0_1543755470443_f74d56d0-4cea-4b10-8aae-a0135d823580-image.png

    0_1543755476457_b941bcaa-6947-41f8-a611-8fa89c746c3d-image.png

    0_1543755482454_ae845c21-37e2-4edd-8e54-4169b02f9274-image.png


Log in to reply
 

Popular Topics

|

Looks like your connection to SCC was lost, please wait while we try to reconnect.