VIP / Speakers

Lighting Show Art of GRPO Training

Time / Place:

⏱️ 09/10 (Wed.) 15:00-15:30 at 2nd Conference Room

Abstract:

這場演講將以簡明但深入的方式介紹 Group Relative Policy Optimization（GRPO）的核心概念與應用。GRPO 是一種專為大型語言模型設計的強化學習方法，透過「群體相對優勢」比較取代傳統的 value network，顯著降低資源需求並提升訓練效率。我們將說明其基本原理、訓練流程與關鍵技巧，並分享在有限 GPU 環境下的實作經驗。

😊 Share this page to friends:

Biography:

黃亮勳 Liang-Hsun Huang
Website: https://www.linkedin.com/in/lianghsunhuang/
Twinkle AI / Founder
創辦 Twinkle AI，專注於開源繁體中文資料集與下一代繁中模型，為台灣 AI 生態奠定基礎並持續推進模型訓練技術。領導團隊打造台灣首個最小推理模型 Formosa-1 (F1)，並曾以一人團隊完成繁體中文語料蒐集與模型訓練，成功推出台灣首個 Llama 3.2 3B 最小推理模型。同時擔任 APMIC AI 工程總監，以大型語言模型訓練與在地化應用聞名，深耕金融、公共部門與教育等領域。在此之前，曾廣泛涉獵網路安全、滲透測試、深度學習與藥物研發，參與 2019 年科技部藥物生成模型研究專案，並於 2020 工業局 AI Hackathon 獲得第四名。是台灣第 36 位 Google TensorFlow Developer Certificate 持有者，並擁有 EC-Council Licensed Penetration Tester (Master) 專業認證。

😊 Share this page to friends:

Previous « Shanti Alexander - Advancing Open Source AI for Economic Growth

Next陳以婕 - 工作坊 - 好好用 AI - 教材首發會 »

Cooperation or Ask questions: ticket@aiacademy.tw