AI真的能編碼嗎？研究勾勒出自助軟件工程的障礙圖景

標簽：北京軟件公司 2025-08-10　次

AI真能編碼嗎？這問題聽起來有點“科幻”呢，但咱們來聊聊這個話題！想象一下，未來AI能像咱們一樣，在鍵盤上噼里啪啦敲代碼，那得多“6”啊！??

但別急，雖然現(xiàn)在技術(shù)發(fā)展得挺“給力”的，但麻省理工的CSAIL實驗室的小伙伴們可沒那么樂觀。他們最近發(fā)了一篇論文，標題就叫做《面向軟件工程的人工智能：挑戰(zhàn)與路徑》。聽起來就挺“高大上”的，對吧？

逐步將AI從自動補全的配角轉(zhuǎn)變?yōu)檎嬲墓こ毯献骰锇? alt=

論文里說了，雖然現(xiàn)在AI在代碼生成這方面已經(jīng)挺“?！绷?，但軟件工程這活兒遠不止寫代碼那么簡單。比如，代碼優(yōu)化、系統(tǒng)遷移、測試分析，還有那些煩人的維護工作，這些AI都還得“練練級”呢。

教授阿曼多·索拉爾-萊扎馬也說了，別看現(xiàn)在大家都說“程序員要失業(yè)了”，但其實軟件工程這事兒可比大學(xué)里的編程課復(fù)雜多了。要實現(xiàn)AI完全接管軟件開發(fā)，咱們還得解決不少難題。

而且，優(yōu)化GPU內(nèi)核、Chrome V8引擎這些大項目，對AI來說還是個不小的挑戰(zhàn)?，F(xiàn)在的評估方法也還不夠成熟，咱們得繼續(xù)努力?。?/p>

所以，AI編碼這事兒，雖然看起來“萌萌噠”，但距離真正實現(xiàn)還差“一丟丟”呢。咱們得繼續(xù)關(guān)注這個領(lǐng)域的發(fā)展，說不定哪天AI就能變成咱們編程界的“老司機”呢！????????????Bench，這玩意兒雖然有點用，但跟咱們大學(xué)的編程練習(xí)似的，幾百行代碼就搞定了，還容易泄露公共倉庫數(shù)據(jù)，太不靠譜了！更別提什么AI重構(gòu)、人機協(xié)同編程、幾百萬行代碼的大工程了，這些才是真刀真槍的實戰(zhàn)?。〕沁@基準能升級到涵蓋這些高風(fēng)險操作，不然咱們評估進展、加速技術(shù)迭代還是個大難題啊，哭遼！

說到評估，那簡直就是個坑，人機交互更是個頭疼的問題。這篇論文的第一作者，MIT的Alex Gu，他都覺得現(xiàn)在的人機互動就像一條“脆弱的溝通線”：你讓他寫代碼，他給你整出一堆又長又亂的文件，甚至是一堆膚淺的單元測試，讓人哭笑不得。更別提AI對調(diào)試器、靜態(tài)分析器這些工具的使用能力了，這玩意兒咱們?nèi)祟愑脕砭_控制和深入理解的，AI搞不定，那可咋整啊！

“我簡直控制不了模型生成的代碼，”Gu說，“AI連自己生成的代碼都不自信，哪來的‘這部分是正確的……這部分可能需要再檢查一下’？開發(fā)者要是盲目信任這些編譯通過但在生產(chǎn)環(huán)境里直接崩潰的‘幻覺邏輯’，那可就完蛋了。關(guān)鍵是，AI得知道什么時候該跟用戶說‘我有點懵，需要你幫忙指個路’??！”

規(guī)模一放大，問題就更多了?，F(xiàn)在的AI模型處理不了大型代碼庫（動輒幾百萬行），基礎(chǔ)模型都是從公共GitHub學(xué)的，但Gu說：“每家公司的代碼庫都不一樣，有獨特的編碼規(guī)范和規(guī)格要求，這超出了模型的訓(xùn)練范圍。”

結(jié)果就是，AI生成的代碼看起來沒問題，但實際上可能調(diào)用不存在的函數(shù)、違反內(nèi)部代碼風(fēng)格規(guī)則，或者導(dǎo)致CI管道失敗。這簡直就是AI生成代碼的“幻覺問題”，看起來合理，但跟公司的內(nèi)部規(guī)范、輔助函數(shù)或架構(gòu)模式都不對勁。

模型的檢索能力也有問題：它只會檢索名稱相似的代碼（就語法層面），而不是功能與邏輯相符的代碼，這可是模型編寫函數(shù)的關(guān)鍵信息。“標準檢索技術(shù)很容易被誤導(dǎo)，”Solar-Lezama補充道。

這些問題沒有萬能的解決方案，作者們呼吁社區(qū)一起努力：更豐富的數(shù)據(jù)（記錄開發(fā)者的編碼過程，比如保留/丟棄的代碼、代碼重構(gòu)過程等）；共享的評估套件（衡量重構(gòu)質(zhì)量、錯誤修復(fù)的持久性及遷移的正確性）；透明的工具（讓模型表達不確定性，讓人引導(dǎo)而不是被動接受）。

Gu把這當(dāng)成了“行動號召”，希望推動大規(guī)模開源合作，讓單個實驗室的力量無法完成的事情變成可能。Solar-Lezama說：“咱們得一起加油，不然這AI編程助手，估計還得再修煉修煉啊！”??????Lezama就設(shè)想了一個逐步進階的藍圖：“咱們得一步步克服這些挑戰(zhàn)，研究成果慢慢就能反饋到商業(yè)工具里去，讓AI從自動補全的配角慢慢變成真正的工程小伙伴?！?/p>

“這事兒為啥這么關(guān)鍵呢？”Gu一語道破，“軟件啊，它可是支撐著金融、交通、醫(yī)療保健還有咱們?nèi)粘Ｉ钸@些方方面面，可現(xiàn)在維護軟件的人手不夠，成了個瓶頸。要是能有個AI能承擔(dān)重活兒，還不會帶出什么bug，那咱們開發(fā)人員就能把心思放在創(chuàng)造力、戰(zhàn)略和倫理這些大事兒上了?！?/p>

“但說到底，咱們得認清現(xiàn)實：代碼補全那是最簡單的，難的是后面所有的活兒，”Gu強調(diào)，“咱們可不是想取代程序員，咱們是想幫他們提升能力——等AI把這些又累又麻煩的活兒都干完了，咱們工程師就能把精力放在只有人類才能搞定的事情上了?！?/p>

那個沒參與這個研究的AI科學(xué)家Baptiste Rozière也忍不住點贊：“現(xiàn)在AI領(lǐng)域啊，跟編碼相關(guān)的新研究層出不窮，社區(qū)都忙著追最新潮流，很難停下來想想哪些才是最關(guān)鍵的難題。這篇論文把人工智能在軟件工程里的關(guān)鍵任務(wù)和挑戰(zhàn)都梳理得明明白白，給咱們這個領(lǐng)域未來的研究指了個明路，我讀著都覺得挺過癮的！”????

GPT-5將如何重塑您的業(yè)務(wù)？解鎖下一代競爭優(yōu)勢的核心密碼基于向量數(shù)據(jù)庫的推薦系統(tǒng)實現(xiàn)：從原理到實踐