輸入您購票時的 Email:

黃亮勳 - Art of GRPO Training - 2025 Taiwan AI Academy Conf

VIP / Speakers

« Back to List

Lighting Show Art of GRPO Training

Time / Place:

⏱️ 09/10 (Wed.) 15:00-15:30 at 2nd Conference Room

Abstract:

這場演講將以簡明但深入的方式介紹 Group Relative Policy Optimization(GRPO) 的核心概念與應用。GRPO 是一種專為大型語言模型設計的強化學習方法,透過「群體相對優勢」比較取代傳統的 value network,顯著降低資源需求並提升訓練效率。我們將說明其基本原理、訓練流程與關鍵技巧,並分享在有限 GPU 環境下的實作經驗。

😊 Share this page to friends:

Biography:

黃亮勳
  • 黃亮勳 Liang-Hsun Huang
    Website: https://www.linkedin.com/in/lianghsunhuang/
  • Twinkle AI / Founder
  • 創辦 Twinkle AI,專注於開源繁體中文資料集與下一代繁中模型,為台灣 AI 生態奠定基礎並持續推進模型訓練技術。領導團隊打造台灣首個最小推理模型 Formosa-1 (F1),並曾以一人團隊完成繁體中文語料蒐集與模型訓練,成功推出台灣首個 Llama 3.2 3B 最小推理模型。 同時擔任 APMIC AI 工程總監,以大型語言模型訓練與在地化應用聞名,深耕金融、公共部門與教育等領域。 在此之前,曾廣泛涉獵網路安全、滲透測試、深度學習與藥物研發,參與 2019 年科技部藥物生成模型研究專案,並於 2020 工業局 AI Hackathon 獲得第四名。是台灣第 36 位 Google TensorFlow Developer Certificate 持有者,並擁有 EC-Council Licensed Penetration Tester (Master) 專業認證。

😊 Share this page to friends:

😊 Share this page to friends: