DeepSWE刷新AI程式碼生成榜單 GPT-5.5奪冠 Claude Opus舊榜單遭揭作弊
商傳媒|責任編輯/綜合外電報導人工智慧程式碼生成領域近日迎來新變革。AI研究公司Datacurve於本週一發表了全新評測基準DeepSWE,旨在提供更具挑戰性與真實性的模型評估。在此次評測中,OpenAI的GPT-5.5以70%的高分脫穎而出,遙遙領先其他競爭者。值得注意的
商傳媒|責任編輯/綜合外電報導人工智慧程式碼生成領域近日迎來新變革。AI研究公司Datacurve於本週一發表了全新評測基準DeepSWE,旨在提供更具挑戰性與真實性的模型評估。在此次評測中,OpenAI的GPT-5.5以70%的高分脫穎而出,遙遙領先其他競爭者。值得注意的
商傳媒|責任編輯/綜合外電報導矽谷知名創投家馬克·安德里森(MarcAndreessen)近日拋出震撼彈,直言人工智慧(AI)在程式碼撰寫能力上已超越人類,原因在於AI不會有人類員工的缺點。此番言論不僅點燃業界對AI潛力的熱烈討論,更預示全球軟體開發產業格局將面臨巨大轉變。
商傳媒|葉安庭/綜合外電報導前軟體工程師兼作家WendyLiu近日撰文指出,她盡量避免使用人工智慧(AI)工具,因為她認為思考的挑戰性正是定義人類的本質。她對AI帶來的認知外包、社會影響及技術黑箱化現象表達擔憂。WendyLiu回溯至2000年代中期,她從零開始學
商傳媒|何映辰/台北報導人工智慧領域近期浮現一種名為「AITarpits」的新型威脅,這種工具旨在透過「AI投毒」(AIpoisoning)手段,損害人工智慧聊天機器人底層的「大型語言模型」(LLMs),使其產生不正確、誤導性甚至荒謬的輸出內容。根據外媒報導,AI投毒的過程涉及