Flazzo memiliki fokus utama untuk menambah nilai bisnis Anda.

Blog

Dua peneliti dalam memperkuat pembelajaran menerima harga 2024 ACM Am Turing

pexels-shvetsa-6250940.jpg
Blog

Dua peneliti dalam memperkuat pembelajaran menerima harga 2024 ACM Am Turing

[ad_1]

Andrew G. Barto Dan Richard S. Sutton telah ditunjuk sebagai penerima 2024 ACM Am Turing Award Untuk kontribusi mereka ke bidang pembelajaran penguatan dari tahun 1980 -an.

Penguatan Pembelajaran adalah metode pelatihan untuk sistem AI yang mengajarkan mereka untuk membuat keputusan yang paling optimal melalui serangkaian sinyal yang disebut hadiah. ChatGPT, misalnya, dibentuk menggunakan metode yang disebut pembelajaran untuk memperkuat umpan balik manusia (RLHF).

Mereka menulis manual “Pembelajaran Penguatan: Pendahuluan” pada tahun 1998, dan masih merupakan referensi standar di lapangan, telah dikutip lebih dari 75.000 kali.

Barto dan Sutton bertanggung jawab untuk mengembangkan banyak pendekatan algoritmik dasar yang digunakan dalam memperkuat pembelajaran, termasuk pembelajaran perbedaan temporal, metode siklus ketiga dan penggunaan jaringan saraf untuk mewakili fungsi yang dipelajari.

Pekerjaan mereka juga mengarah pada penemuan di bidang ilmu saraf, khususnya bahwa algoritma pembelajaran penguatan tertentu dapat menjelaskan sistem dopamin di otak.

“Karya Barto dan Sutton menunjukkan potensi besar untuk menerapkan pendekatan multidisiplin untuk tantangan lama di bidang kami,” kata Yannis Ioannidis, presiden ACM. “Dari bidang penelitian mulai dari ilmu kognitif dan psikologi ilmu saraf telah mengilhami perkembangan penguatan pembelajaran, yang telah melemparkan fondasi dari beberapa kemajuan paling penting dalam AI dan memberi kami gambaran yang lebih penting tentang otak. Karya Barto dan Sutton bukanlah batu loncatan yang sekarang telah kita berevolusi. Belajar dengan memperkuat terus tumbuh dan menawarkan potensi besar untuk kemajuan baru di dalamnya dan banyak disiplin ilmu lainnya. Adalah normal bahwa kami menghormati mereka harga paling bergengsi di bidang kami. »»

Barto adalah profesor emeritus informasi dan ilmu komputer di University of Massachusetts Amherst, dan Sutton adalah seorang profesor ilmu komputer di University of Alberta, peneliti di Keen Technologies, dan anggota Alberta Machine Intelligence Institute.

[ad_2]