Original Title: Sustainable AI: Environmental Implications, Challenges and Opportunities
Disclaimer: Summary generated by AI based on the provided document. Please refer to the original paper for full scientific accuracy.

បញ្ញាសិប្បនិម្មិតប្រកបដោយចីរភាព៖ ផលប៉ះពាល់បរិស្ថាន បញ្ហាប្រឈម និងឱកាស

ចំណងជើងដើម៖ Sustainable AI: Environmental Implications, Challenges and Opportunities

អ្នកនិពន្ធ៖ Carole-Jean Wu (Meta AI), Ramya Raghavendra (Meta AI), Udit Gupta (Meta AI, Harvard University)

ឆ្នាំបោះពុម្ព៖ 2022 (Proceedings of the 5th MLSys Conference)

វិស័យសិក្សា៖ Computer Science / Environmental Sustainability

១. សេចក្តីសង្ខេបប្រតិបត្តិ (Executive Summary)

បញ្ហា (The Problem)៖ ការសិក្សានេះដោះស្រាយបញ្ហានៃការកើនឡើងយ៉ាងឆាប់រហ័សនៃផលប៉ះពាល់បរិស្ថានដែលបង្កឡើងដោយ បញ្ញាសិប្បនិម្មិត (AI) ជាពិសេសកំណើនអិចស្ប៉ូណង់ស្យែលនៃទិន្នន័យ និងតម្រូវការផ្នែករឹងដែលនាំឱ្យមានការបញ្ចេញកាបូនខ្ពស់។

វិធីសាស្ត្រ (The Methodology)៖ អ្នកស្រាវជ្រាវបានប្រើប្រាស់វិធីសាស្ត្រសាកល្បងបែប វិភាគវដ្តជីវិត (Life Cycle Analysis) ដើម្បីវាយតម្លៃផលប៉ះពាល់បរិស្ថាននៅគ្រប់ដំណាក់កាលនៃការអភិវឌ្ឍប្រព័ន្ធ AI ចាប់ពីការផលិតរហូតដល់ការប្រើប្រាស់។

លទ្ធផលសំខាន់ៗ (The Verdict)៖

២. ការវិភាគលើប្រសិទ្ធភាព និងដែនកំណត់ (Performance & Constraints)

វិធីសាស្ត្រ (Method) គុណសម្បត្តិ (Pros) គុណវិបត្តិ (Cons) លទ្ធផលគន្លឹះ (Key Result)
Standard Large Scale Training
ការបង្វឹកគំរូខ្នាតធំតាមបែបស្តង់ដារ (ឧ. GPT-3)
ផ្តល់នូវភាពត្រឹមត្រូវខ្ពស់ (High Accuracy) និងសមត្ថភាពទូទៅល្អក្នុងការបំពេញភារកិច្ចផ្សេងៗ។ ប្រើប្រាស់ថាមពលអគ្គិសនី និងធនធានផ្នែករឹងយ៉ាងច្រើនសន្ធឹកសន្ធាប់ ដែលនាំឱ្យមានការបំភាយកាបូនខ្ពស់។ ការបង្វឹកគំរូ GPT-3 តែមួយបង្កើតកាបូនច្រើនជាងរថយន្តធម្មតាជិះបានចម្ងាយជាង ២សែនម៉ៃល៍។
Holistic Hardware-Software Optimization
ការបង្កើនប្រសិទ្ធភាពរួមគ្នារវាងផ្នែករឹង និងផ្នែកទន់ (Co-design)
កាត់បន្ថយការប្រើប្រាស់ថាមពលប្រតិបត្តិការយ៉ាងខ្លាំង និងបង្កើនល្បឿននៃការគណនា។ ទាមទារឱ្យមានការរចនាស្មុគស្មាញ និងជំនាញខ្ពស់ក្នុងការកែតម្រូវទាំងផ្នែករឹង (Hardware) និងកូដ (Algorithm)។ កាត់បន្ថយការប្រើប្រាស់ថាមពលប្រតិបត្តិការរហូតដល់ ៨០០ដង សម្រាប់គំរូកែប្រែភាសា (Translation Model)។
Federated Learning (FL)
ការរៀនបែបសហព័ន្ធ (បង្វឹកលើឧបករណ៍អ្នកប្រើប្រាស់ផ្ទាល់)
ការពារឯកជនភាពទិន្នន័យ (Data Privacy) ដោយមិនចាំបាច់បញ្ជូនទិន្នន័យទៅកាន់មជ្ឈមណ្ឌលទិន្នន័យ។ ប្រើប្រាស់ថាមពលច្រើនសម្រាប់ការបញ្ជូនទិន្នន័យ (Communication) និងពិបាកគ្រប់គ្រងប្រសិទ្ធភាពថាមពលលើឧបករណ៍ចម្រុះ។ ការបំភាយកាបូនអាចប្រហាក់ប្រហែល ឬខ្ពស់ជាងការបង្វឹកនៅមជ្ឈមណ្ឌលទិន្នន័យ ដោយសារតម្រូវការថាមពលនៃការបញ្ជូន។

ការចំណាយលើធនធាន (Resource Cost)៖ ការសិក្សានេះបង្ហាញថាការអភិវឌ្ឍ AI ទាមទារធនធានកុំព្យូទ័រ និងថាមពលយ៉ាងច្រើនសម្បើម ជាពិសេសនៅក្នុងដំណាក់កាលផលិតផ្នែករឹង និងការបង្វឹក។

៣. ការពិនិត្យសម្រាប់បរិបទកម្ពុជា/អាស៊ីអាគ្នេយ៍

ភាពលំអៀងនៃទិន្នន័យ (Data Bias)៖

ការសិក្សានេះផ្អែកលើទិន្នន័យពីក្រុមហ៊ុន Meta (Facebook) ដែលប្រើប្រាស់មជ្ឈមណ្ឌលទិន្នន័យខ្នាតយក្ស និងថាមពលកកើតឡើងវិញនៅសហរដ្ឋអាមេរិក។ សម្រាប់កម្ពុជា ការសន្និដ្ឋានខ្លះអាចនឹងមិនឆ្លុះបញ្ចាំងទាំងស្រុង ដោយសារកម្ពុជាពុំទាន់មានហេដ្ឋារចនាសម្ព័ន្ធ Hyperscale Data Center ហើយប្រភពថាមពលនៅចម្រុះនៅឡើយ។

លទ្ធភាពនៃការអនុវត្ត (Applicability)៖

ទោះបីជាកម្ពុជាមិនទាន់ផលិត AI ខ្នាតយក្ស ប៉ុន្តែគោលការណ៍នៃ Green AI គឺមានសារៈសំខាន់ខ្លាំងសម្រាប់ការអភិវឌ្ឍវិស័យបច្ចេកវិទ្យាប្រកបដោយចីរភាព។

ការអនុវត្តតាមការណែនាំក្នុងឯកសារនេះនឹងជួយឱ្យអ្នកអភិវឌ្ឍន៍នៅកម្ពុជាអាចបង្កើតដំណោះស្រាយ AI ដែលមានប្រសិទ្ធភាពខ្ពស់ តែចំណាយថវិកា និងថាមពលតិច។

៤. ផែនការសកម្មភាពសម្រាប់និស្សិត (Actionable Roadmap)

ដើម្បីអនុវត្តតាមការសិក្សានេះ និស្សិតគួរអនុវត្តតាមជំហានខាងក្រោម៖

  1. ជំហានទី ១៖ ការយល់ដឹង និងវាស់វែងផលប៉ះពាល់: និស្សិតត្រូវរៀនប្រើប្រាស់ឧបករណ៍ដូចជា Python library CodeCarbon ឬ MLCO2 ដើម្បីវាស់វែងការបញ្ចេញកាបូនរាល់ពេលបង្វឹកគំរូ AI របស់ខ្លួន។
  2. ជំហានទី ២៖ ការជ្រើសរើសគំរូដែលមានប្រសិទ្ធភាព: ជំនួសឱ្យការប្រើគំរូធំៗ គួរងាកមកប្រើគំរូដែលតូចតែមានសមត្ថភាពដូចជា DistilBERT ឬ MobileNet ដែលសាកសមសម្រាប់ការប្រើប្រាស់លើទូរស័ព្ទដៃ និងចំណាយថាមពលតិច។
  3. ជំហានទី ៣៖ ការបង្កើនប្រសិទ្ធភាពកូដ និងទិន្នន័យ: អនុវត្តបច្ចេកទេស Quantization (បម្លែងទិន្នន័យពី 32-bit ទៅ 8-bit) ក្នុង PyTorch ឬ TensorFlow ដើម្បីកាត់បន្ថយទំហំគំរូ និងបង្កើនល្បឿន។
  4. ជំហានទី ៤៖ ការប្រើប្រាស់ហេដ្ឋារចនាសម្ព័ន្ធដែលមានស្រាប់: ជៀសវាងការទិញ Hardware ថ្មីដោយមិនចាំបាច់ (ដើម្បីកាត់បន្ថយ Embodied Carbon) ដោយប្រើប្រាស់សេវាកម្ម Cloud ឬ Google Colab សម្រាប់ការពិសោធន៍ខ្នាតតូច។

៥. វាក្យសព្ទបច្ចេកទេស (Technical Glossary)

ពាក្យបច្ចេកទេស ការពន្យល់ជាខេមរភាសា (Khmer Explanation) និយមន័យសាមញ្ញ (Simple Definition)
Embodied Carbon Footprint ការបំភាយឧស្ម័នកាបូនដែលកើតចេញពីដំណើរការផលិតរចនាសម្ព័ន្ធផ្នែករឹង (Hardware) ការជីកយកធនធានរ៉ែ ការដឹកជញ្ជូន និងការដំឡើងឧបករណ៍ មុនពេលដែលឧបករណ៍នោះត្រូវបានយកមកប្រើប្រាស់ជាក់ស្តែង។ ប្រៀបដូចជាការបំពុលបរិស្ថានដែលកើតឡើងនៅពេលសាងសង់រថយន្តមួយគ្រឿង មិនមែនផ្សែងដែលចេញពេលកំពុងបើកបរនោះទេ។
Operational Carbon Footprint ការបំភាយឧស្ម័នកាបូនដែលកើតឡើងពីការប្រើប្រាស់ថាមពលអគ្គិសនីដើម្បីដំណើរការកុំព្យូទ័រ និងប្រព័ន្ធត្រជាក់នៅក្នុងមជ្ឈមណ្ឌលទិន្នន័យ (Data Centers) នៅពេលកំពុងបង្វឹក (Training) ឬប្រើប្រាស់ (Inference) គំរូ AI។ ប្រៀបដូចជាផ្សែងដែលចេញពីរថយន្តនៅពេលកំពុងជិះនៅលើដងផ្លូវ ដែលកើតពីការដុតប្រេង។
Life Cycle Analysis (LCA) វិធីសាស្ត្រវាយតម្លៃផលប៉ះពាល់បរិស្ថានសរុបនៃផលិតផល ឬប្រព័ន្ធបច្ចេកវិទ្យាមួយ ចាប់តាំងពីដំណាក់កាលផលិត ការដឹកជញ្ជូន ការប្រើប្រាស់ រហូតដល់ការបោះចោល ឬកែច្នៃឡើងវិញ។ ដូចជាការគណនាចំណាយសរុបនៃការមានផ្ទះមួយ រាប់តាំងពីថ្លៃសាងសង់ ថ្លៃទឹកភ្លើងប្រចាំខែ រហូតដល់ថ្លៃវាយកម្ទេចចោល។
Federated Learning បច្ចេកទេសបង្វឹក AI ដោយផ្ទាល់នៅលើឧបករណ៍អ្នកប្រើប្រាស់ (ដូចជាទូរស័ព្ទដៃ) ដោយមិនចាំបាច់បញ្ជូនទិន្នន័យឯកជនទៅកាន់ម៉ាស៊ីនមេ (Server) នោះទេ គឺបញ្ជូនតែលទ្ធផលនៃការរៀនប៉ុណ្ណោះ ដើម្បីការពារឯកជនភាព។ ដូចជាសិស្សរៀននៅផ្ទះរៀងៗខ្លួន ហើយគ្រាន់តែផ្ញើចម្លើយទៅគ្រូដើម្បីកែ ដោយមិនចាំបាច់យកសៀវភៅ ឬទៅជុំគ្នានៅសាលា។
Quantization ដំណើរការបច្ចេកទេសក្នុងការកាត់បន្ថយភាពលម្អិតនៃទិន្នន័យលេខ (ឧទាហរណ៍ពី ៣២-bit មក ១៦-bit ឬ ៨-bit) ដើម្បីឱ្យគំរូ AI មានទំហំតូចជាងមុន និងដំណើរការលឿនជាងមុន ដោយមិនបាត់បង់ភាពត្រឹមត្រូវច្រើន។ ដូចជាការកាត់យកលេខក្រោយក្បៀសតិចៗ (ឧ. ប្រើ ៣.១៤ ជំនួស ៣.១៤១៥៩...) ដើម្បីគណនាបានលឿន និងចំណាយក្រដាសសរសេរតិច។
Neural Architecture Search (NAS) ការប្រើប្រាស់កុំព្យូទ័រដើម្បីស្វែងរក និងរចនារចនាសម្ព័ន្ធបណ្តាញសរសៃប្រសាទ (Neural Network) ដោយស្វ័យប្រវត្តិ ដែលជាដំណើរការចំណាយថាមពលខ្លាំងព្រោះត្រូវសាកល្បងម៉ូដែលរាប់ពាន់។ ដូចជាការប្រើមនុស្សយន្តឱ្យសាកល្បងសាងសង់ប្រាសាទ Lego រាប់លានរបៀបផ្សេងៗគ្នា ដើម្បីរកមើលមួយណាដែលរឹងមាំជាងគេ។
Jevon’s Paradox បាតុភូតសេដ្ឋកិច្ចដែលបង្ហាញថា នៅពេលបច្ចេកវិទ្យាកាន់តែមានប្រសិទ្ធភាព (ប្រើថាមពលតិច) ការប្រើប្រាស់ជាក់ស្តែងបែរជាកើនឡើងខ្លាំង ដែលនាំឱ្យការប្រើប្រាស់ធនធានសរុបកើនឡើងលើសដើមទៅវិញ។ នៅពេលឡានស៊ីសាំងតិច មនុស្សបែរជាជិះលេងកាន់តែច្រើន និងឆ្ងាយជាងមុន ដែលធ្វើឱ្យការប្រើប្រាស់ប្រេងសរុបកើនឡើងទៅវិញ។

៦. ប្រធានបទពាក់ព័ន្ធ (Further Reading)

អត្ថបទដែលបានបោះពុម្ពនៅលើ KhmerResearch ដែលទាក់ទងនឹងប្រធានបទនេះ៖