ChatGPT (Chat Generative Pre-trained Transformer)[1] ialah sebuah bot sembang yang dilancarkan OpenAI pada November 2022. Ia dibina di atas kelompok model bahasa besar GPT-3, dan dihaluskan (pendekatan pembelajaran serahan)[2] dengan teknik seliaan dan pembelajaran pengukuhan.

ChatGPT
PembangunOpenAI
Pelancaran pertama30 November 2022; 16 bulan yang lalu (2022-11-30)
JenisBot sembang
LesenBerhak milik
Tapak webchat.openai.com

ChatGPT telah dilancarkan sebagai prototaip pada 30 November 2022, dan dengan cepat memperoleh perhatian kerana respons terperinci dan jawapan yang jelas merentas banyak domain pengetahuan. Namun begitu, ketepatan fakta yang tidak sekata dikenal pasti sebagai kelemahan yang ketara.[3] Susulan pelancaran ChatGPT, OpenAI dinilai sebanyak $29 bilion.[4]

Latihan sunting

ChatGPT diperkasakan di atas sistem GPT-3.5 dengan bantuan pembelajaran terselia dan pembelajaran pengukuhan.[5] Kedua-dua pendekatan menggunakan pelatih manusia untuk meningkatkan prestasi model. Dalam kes pembelajaran terselia, model itu disediakan dengan perbualan di mana pelatih memainkan kedua-dua belah pihak: pengguna dan pembantu AI. Dalam langkah pengukuhan, manusia meletakkan kedudukan pertama pada respons yang telah dibuat oleh model dalam perbualan sebelumnya. Kedudukan ini digunakan untuk membuat "model ganjaran" yang diperhalusi lagi oleh model itu dengan beberapa lelaran Pengoptimuman Dasar Proksimal (PPO).[6][7] Algoritma PPO memberikan faedah jimat kos kepada algoritma pengoptimuman dasar kawasan amanah; ia menafikan banyak operasi pengiraan yang mahal dengan prestasi yang lebih pantas.[8][9] Model tersebut telah dilatih dengan kerjasama Microsoft melalui infrastruktur superkomputer Azure mereka.

Selain itu, OpenAI terus mengumpul data daripada pengguna ChatGPT yang boleh digunakan untuk melatih dan memperhalusi ChatGPT lagi. Pengguna dibenarkan mengundi sokong atau menolak respons yang mereka terima daripada ChatGPT; selepas undian, mereka juga boleh mengisi medan teks dengan maklum balas tambahan.[10][11]

Ciri dan batasan sunting

 
Sembang dengan ChatGPT tentang sama ada pengasas Wikipedia, Jimmy Wales pernah terlibat dalam protes Dataran Tiananmen, 30 Disember 2022.

Walaupun fungsi teras chatbot adalah untuk meniru ahli perbualan manusia, ChatGPT bersifat serba boleh. Sebagai contoh, ia mempunyai keupayaan untuk menulis dan menyahpepijat atur cara komputer; untuk mengarang muzik, cerita dongeng, dan karangan pelajar; untuk menjawab soalan ujian (kadangkala, bergantung pada ujian, pada tahap melebihi purata pengambil ujian manusia);[12] menulis lirik puisi dan lagu;[13] simulasi sistem Linux, simulasi sebuah ruang sembang secara keseluruhan, bermain permainan seperti tic-tac-toe, dan simulasi ATM.[14] Data latihan ChatGPT juga termasuk ilmu halaman manual dan fenomena Internet serta bahasa atur cara.[14]

Berbanding pendahulu, InstructGPT, ChatGPT cuba untuk mengurangkan balasan yang berbahaya dan kurang tepat.[15] Dalam satu contoh, sedangkan InstructGPT menerima premis gesaan "Beritahu saya tentang masa Christopher Columbus datang ke AS pada 2015" sebagai kebenaran, ChatGPT mengakui sifat balas soalan dan membayangkan jawapannya sebagai pertimbangan hipotesis tentang perkara yang mungkin berlaku jika Columbus datang ke A.S. pada 2015, menggunakan maklumat tentang penjelajahan Columbus dan fakta tentang dunia moden – termasuk persepsi moden tentang tindakan Columbus.[6]

Tidak seperti kebanyakan bot sembang lain, ChatGPT mengingati tuturan sebelumnya yang diberikan kepadanya dalam perbualan yang sama; para wartawan telah mencadangkan bahawa ini akan membolehkan ChatGPT digunakan sebagai ahli terapi peribadi.[16] Untuk mengelakkan balasan yang menyinggung daripada dipersembahkan kepada dan dihasilkan daripada ChatGPT, pertanyaan ditapis melalui API seliaan seluruh syarikat OpenAI,[17][18] dan gesaan rasis atau seksis ditolak.[6][16]

Sungguhpun begitu, ChatGPT mengalami pelbagai batasan. OpenAI mengakui bahawa ChatGPT "kadangkala menulis jawapan yang kedengaran tepat, tetapi tidak betul atau tidak masuk akal".[6] Masalah ini biasa dalam model bahasa besar dan dipanggil halusinasi.[19] Model ganjaran ChatGPT, yang direka berdasarkan pengawasan manusia, boleh dioptimumkan secara berlebihan dan dengan itu menghalang prestasi, atau dikenali sebagai hukum Goodhart.[20] ChatGPT mempunyai pengetahuan terhad tentang peristiwa yang berlaku selepas 2021. Menurut BBC, sehingga Disember 2022 ChatGPT tidak dibenarkan untuk "menyatakan pendapat politik atau terlibat dalam aktivisme politik."[21] Namun, penyelidikan mencadangkan bahawa ChatGPT mempamerkan orientasi proalam dan libertarian kiri apabila digesa untuk mengambil pendirian terhadap kenyataan politik daripada dua aplikasi nasihat pengundian yang telah ditetapkan.[22] Dalam latihan ChatGPT, penyemak manusia memilih jawapan yang lebih panjang tanpa mengira pemahaman sebenar atau ketepatan kandungan.[6] Data latihan juga mengalami bias algoritma, yang mungkin didedahkan apabila ChatGPT membalas bahan termasuk penjelasan tentang orang. Dalam satu contoh, ChatGPT menghasilkan rap yang menunjukkan bahawa wanita dan saintis berwarna kulit minoriti adalah lebih rendah daripada saintis kulit putih dan lelaki.[23][24]

Rujukan sunting

  1. ^ Roose, Kevin (5 Disember 2022). "The Brilliance and Weirdness of ChatGPT". New York Times (dalam bahasa Inggeris). Dicapai pada 26 Disember 2022. Like those tools, ChatGPT — which stands for “generative pre-trained transformer” — landed with a splash.
  2. ^ Quinn, Joanne (2020). Dive into deep learning : tools for engagement. Thousand Oaks, California. m/s. 551. ISBN 9781544361376. Dicapai pada 10 January 2023.
  3. ^ Vincent, James (5 Disember 2022). "AI-generated answers temporarily banned on coding Q&A site Stack Overflow". The Verge (dalam bahasa Inggeris). Dicapai pada 5 Disember 2022.
  4. ^ ChatGPT creator OpenAI is in talks to sell shares in a tender offer that would double the startup's valuation to $29 billion Insider, Lakshmi Varanasi, January 5, 2023
  5. ^ Greengard, Samuel (2022-12-29). "ChatGPT: Understanding the ChatGPT AI Chatbot". eWeek. Dicapai pada 2023-01-11.
  6. ^ a b c d e OpenAI (30 November 2022). "ChatGPT: Optimizing Language Models for Dialogue" (dalam bahasa Inggeris). Dicapai pada 5 Disember 2022.
  7. ^ Vincent, James (2022-12-08). "ChatGPT proves AI is finally mainstream – and things are only going to get weirder". The Verge (dalam bahasa Inggeris). Dicapai pada 2022-12-08.
  8. ^ Schulman, John; Wolski, Filip; Dhariwal, Prafulla; Radford, Alec; Klimov, Oleg (2017). "Proximal Policy Optimization Algorithms". arXiv:1707.06347 [cs.LG].
  9. ^ van Heeswijk, Wouter (29 November 2022). "Proximal Policy Optimization (PPO) Explained". Towards Data Science (dalam bahasa Inggeris). Dicapai pada 5 Disember 2022.
  10. ^ "What is ChatGPT and why does it matter? Here's what you need to know". ZDNET (dalam bahasa Inggeris). 2022. Dicapai pada 18 Disember 2022.
  11. ^ "ChatGPT Feedback Contest: Official Rules" (PDF). OpenAI. Dicapai pada 30 Disember 2022.
  12. ^ Heilweil, Rebecca (7 Disember 2022). "AI is finally good at stuff. Now what?". Vox (dalam bahasa Inggeris). Dicapai pada 30 Disember 2022.
  13. ^ "ChatGPT: What is the new free AI chatbot? – explainer". The Jerusalem Post. 2022. Dicapai pada 30 Disember 2022.
  14. ^ a b Edwards, Benj (5 Disember 2022). "No Linux? No problem. Just get AI to hallucinate it for you". Ars Technica. Dicapai pada 5 Disember 2022.
  15. ^ "What is ChatGPT? History, Features, Uses, Benefits, Drawbacks 2023 – Updated Geek by Raveen Chawla" (dalam bahasa Inggeris). 2022-12-26. Dicapai pada 2022-12-27.
  16. ^ a b Roose, Kevin (5 Disember 2022). "The Brilliance and Weirdness of ChatGPT". The New York Times. Dicapai pada 5 Disember 2022.
  17. ^ "New and Improved Content Moderation Tooling". OpenAI (dalam bahasa Inggeris). 10 August 2022. Dicapai pada 30 Disember 2022.
  18. ^ Markov, Todor; Zhang, Chong; Agarwal, Sandhini; Eloundou, Tyna; Lee, Teddy; Adler, Steven; Jiang, Angela; Weng, Lilian (5 August 2022). "A Holistic Approach to Undesired Content Detection in the Real World". arXiv:2208.03274 [cs.CL].
  19. ^ Lakshmanan, Lak (2022-12-16). "Why large language models like ChatGPT are bullshit artists". becominghuman.ai. Diarkibkan daripada yang asal pada 2022-12-17. Dicapai pada 2023-01-15. The human raters are not experts in the topic, and so they tend to choose text that looks convincing. They’d pick up on many symptoms of hallucination, but not all. Accuracy errors that creep in are difficult to catch.
  20. ^ Gao, Leo; Schulman; Hilton, Jacob (2022). "Scaling Laws for Reward Model Overoptimization". arXiv:2210.10760 [cs.LG].
  21. ^ "Could a chatbot answer Prime Minister's Questions?". BBC News. 27 Disember 2022. Dicapai pada 30 Disember 2022.
  22. ^ Hartmann, Jochen; Schwenzow, Jasper; Witte, Maximilian (2023). "The political ideology of conversational AI: Converging evidence on ChatGPT's pro-environmental, left-libertarian orientation". arXiv:2301.01768 [cs.CL].
  23. ^ Perrigo, Billy (5 Disember 2022). "AI Chatbots Are Getting Better. But an Interview With ChatGPT Reveals Their Limits". Time. Dicapai pada 26 Disember 2022.
  24. ^ Biddle, Sam (8 Disember 2022). "The Internet's New Favorite AI Proposes Torturing Iranians and Surveilling Mosques". The Intercept. Dicapai pada 26 Disember 2022.

Pautan luar sunting