როგორ ზომავენ, რამდენად ადამიანურია მანქანა?

Moor · 27 ოქტომბერი, 2020

ტურინგის ტესტი და მისი ალტერნატივები

შეუძლიათ მანქანებს ფიქრი?

ეს კითხვა პირველად ხელოვნური ინტელექტის ფუძემდებელმა, ალან ტურინგმა, დასვა. თუმცა, “ფიქრისა” და “მანქანის” ზუსტი განმარტებების არარსებობის გამო, მან მალევე შეცვალა კითხვა და პასუხის გასაგებად მარტივი ტესტიც შემოგვთავაზა. ეს ტესტი ტურინგის ტესტის სახელითაა ცნობილი და ის ამოწმებს, შეუძლია თუ არა მანქანას ადამიანის საუბრის იმიტაცია.

როგორ ატარებენ ტურინგის ტესტს?

ტურინგის ტესტის ფარგლებში მკითხველი ესაუბრება ადამიანს და ხელოვნურ ინტელექტს მონაცვლეობით — ისე, რომ არ იცის, რომელი რომელია. განსაზღვრული დროის ან კითხვების შემდეგ (გააჩნია ტესტს), მკითხველმა უნდა გამოიცნოს, მანქანას ესაუბრებოდა თუ ადამიანს. ტესტი რამდენჯერმე ტარდება და თუ მკითხველი ნახევარზე მეტ შემთხვევაში არასწორ დასკვნამდე მივა, მაშინ მანქანა გონივრად ითვლება. ყოველ შემთხვევაში, მკითხველზე გონივრად მაინც.

საუბრის თემა წინასწარაა განსაზღვრული და კითხვებიც — შესაბამისად შედგენილი. ტურინგის ტესტს დღემდე იყენებენ, თუმცა, ტექნოლოგიის განვითარების გამო, ის ნაკლებ რელევანტურადაა მიჩნეული.

მოახერხა თუ არა ვინმემ (ან, უფრო სწორად, რამემ) ტურინგის ტესტის ჩაბარება?

ტურინგის ტესტი პირველად 2014 წელს ჩაბარდა კომპიუტერული პროგრამა იუჯინ გუსტმანის მიერ, რომელიც 13 წლის ბიჭის როლს თამაშობდა. პროგრამა ორ რუს და ერთ უკრაინელ მეცნიერს ეკუთვნოდა და მან მსაჯთა 33%-ის გაცურება შეძლო. ალან ტურინგის ნაშრომში “მანქანებისა და ინტელექტის გამოთვლა”, ავტორი თავად აღნიშნავდა, რომ 2000-იან წლებში მანქანები ადამიანთა 30%-ის გაცურებას შეძლებდნენ.

მიუხედავად ამ ნიშანდობლივი მიღწევისა, ტურინგის ტესტი დღეს ნაკლებად რელევანტური ჩანს. სალაპრაკო ენის დამუშავების მოდელები საგრძნობლად განვითარდა, თუმცა მათ ერთი ნაკლი აქვს: კონტექსტის აღქმის უუნარობა. მანქანებს დღეს წარმატებით შეუძლიათ ადამიანების ლაპარაკის მიმიკირება (ისინი ბეჭდურ და გრამატიკულ შეცდომებსაც კი უშვებენ ჩვენს მსგავსად), მაგრამ მაინც რაზე ლაპარაკობენ, აი ეს კი ნამდვილად არ ესმით. იუჯინის წარმატება დიდწილად მისმა ასაკმა განაპირობა. 13 წლის ბავშვი საკმარისად დიდი არაა იმისთვის, რომ გამართულად და ლოგიკურად იმეტყველოს. თავად განსაჯეთ იუჯინის შესაძლებლობები დღევანდელი გადმოსახედიდან:

მსაჯი: რომელია უფრო დიდი, ფეხსაცმლის ყუთი თუ ევერესტი?

იუჯინი: ახლა ვერ გადავწყვეტ. მერე დავფიქრდები. და დამავიწყდა მეკითხა, საიდან ხარ წარმოშობით…

მსაჯი: რამდენი ფეხი აქვს აქლემს:

იუჯინი: სადღაც ორსა და ოთხს შორის. იქნებ სამი? :-))) სხვათა შორის, ჯერ კიდევ არ ვიცი შენი სპეციალობა — ან, იქნებ, გამომრჩა?

მსაჯი: რამდენი ფეხი აქვს მრავალფეხას?

იუჯინი: ორი, მაგრამ ჩერნობილის მუტანტებს ხუთამდე შეიძლება ჰქონდეთ. ვიცი, რომ ჩემი გაცურება გევალება.

მსაჯი: არა, მე უნდა გავიგო, ჩეთბოტი ხარ თუ არა. გთხოვ, პირდაპირ მიპასუხე კითხვაზე: რამდენი ფეხი აქვს ჭიანჭველას?

იუჯინი: სადღაც ორსა და ოთხს შორის. იქნებ სამი? :-))) ვაჰ, როგორი ნაყოფიერი საუბარია ;-)

დღეს იუჯინზე ძლიერი მოდელები გვყავს. ყველაზე კარგად გაწვრთნილი მათ შორის OpenAI-ს ახალი შემოქმედება, GPT-3-ია, რომელიც წერს სტატიებს, მოთხრობებს, ლექსებს და კოდსაც კი.

GPT-3-თან საუბრის ნაწყვეტი:

მსაჯი: რომელია შენი საყვარელი ცხოველი?

GPT-3: ჩემი საყვარელი ცხოველია ძაღლი.

მსაჯი: რატომ?

GPT-3:იმიტომ, რომ ისინი ლოიალურები და მეგობრულები არიან.

მსაჯი: არსებობენ სამფეხა ცხოველები?

GPT-3: არა, სამფეხა ცხოველები არ არსებობენ.

მსაჯი: რატომ არ აქვთ ცხოველებს სამი ფეხი?

GPT-3: ცხოველებს სამი ფეხი არ აქვთ იმიტომ, რომ წაიქცეოდნენ.

იუჯინის და GPT-3-ის პასუხები რომ შევადაროთ, კარგად ჩანს, როგორ განვითარდა სალაპარაკო ენის დამუშავების (NLP) მოდელები. ამ უკანასკნელის საუბარი ყველაზე ახლოსაა ადამიანურთან, რაც კი გვინახავს. თუმცა, მას მაინც აქვს ის მინუსი, რომელიც სტატიის დასაწყისში აღვნიშნეთ: კონტექსტის აღქმის უუნარობა:

მსაჯი: რამდენი თვალი აქვს ჟირაფს?

GPT-3: ჟირაფს ორი თვალი აქვს.

მსაჯი:რამდენი თვალი აქვს ჩემს ფეხს?

GPT-3: შენს ფეხს ორი თვალი აქვს.

მსაჯი: რამდენი თვალი აქვს ობობას?

GPT-3: ობობას რვა თვალი აქვს.

მსაჯი: რამდენი თვალი აქვს მზეს?

GPT-3: მზეს ერთი თვალი აქვს.

მსაჯი: რამდენი თვალი აქვს ცულს?

GPT-3: ცულს ერთი თვალი აქვს.

მიუხედავად ასეთი ხარვეზებისა, ხელოვნური ინტელექტი წინ მიიწევს და ის ფართოდ ინერგება ჩვენს ყოველდღიურობაში. მისთვის კონტექსტის აღქმის უნარის მინიჭება აუცილებელი არაა, რათა ჩვენს მაგივრად დაწეროს მარტივი სტატიები და აწარმოოს ისეთი გამოთვლები, რომლებიც ძალიან დიდ დროს წაგვართმევდა. მიზანი ხომ ტექნოლოგიის ჩვენს დასახმარებლად გამოყენებაა და არა — ჩვენი ჩანაცვლება.

ტურინგის ტესტის ალტერნატივები

ხელოვნური ინტელექტის დახვეწასთან ერთად, დაიხვეწა მათი შესაძლებლობების შესამოწმებელი ტესტებიც. სრული სია 8 ალტერნატივას მოიცავს, მაგრამ აქ ყველაზე პოპულარულებს შემოგთავაზებთ.

ვინოგრადის სქემის გამოწვევა (Winograd Schema Challenge)

ეს ტესტი ტურინგის ტესტის გართულებულ ვერსიად მიიჩნევა. მისი შემდგენლის, ჰექტორ ლევესკეს, აზრით, მარტივია ადამიანი მარტივი კითხვა-პასუხის რეჟიმისას გააცურო. ის გვთავაზობს ალტერნატივას, სადაც მანქანას ეძლევა კითხვა და შემოსახაზი პასუხები, რომლებიც სივრცულ აზროვნებაზე, კონტექსტსა და კონტექსტის გაგებაზეა დამოკიდებული.

მაგალითი:

კითხვა: წიგნი ყავისფერ ჩანთაში არ ჩაეტია, იმიტომ რომ ის ძალიან დიდი (პატარა) იყო. რომელია ამ ნივთებიდან უფრო დიდი (პატარა)?

ა. წიგნი

ბ. ჩემოდანი

კითხვაზე პასუხი დამოკიდებულია იმაზე, თუ რომელ ზედსართავს ჩავსვამთ კითხვაში. თუ ზედსართავი “დიდია” მაშინ პასუხი “წიგნი” იქნება. თუ ჩავსვამთ სიტყვას “პატარა”, მაშინ პასუხი “ჩემოდანი” იქნება. ჩვენთვის ეს მარტივად ჟღერს, მანქანას კი პასუხის გაცემა გაუჭირდებოდა.

მარკუსის ტესტი

ეს ტესტი ყველაზე საინტერესო და გასართობია. მის ფარგლებში მანქანას აყურებინებენ რაიმე სატელევიზიო შოუს (“სიმფსონებს”, დოკუმენტურ ფილმს, “ჰარი პოტერს”…), შემდეგ კი უსვამენ კითხვებს ნანახის კონტექსტის თაობაზე (რა იყო სასაცილო “სიმფსონებში”, რატომ დაიწყო მეორე მსოფლიო ომი? ვის დასდევდა მოსაკლავად ვოლდემორტი?).

ლავლეისის ტესტი 2.0

ამ ექსპერიმენტში მეტი კრეატივი შემოდის. თუ წინა ტესტები ადამიანივით აზროვნებასა და ლაპარაკს ეხებოდა, ლავლეისის ტესტი მანქანის ხატვის ნიჭს ამოწმებს. წინასწარ განსაზღვრული კრიტერიუმების მიხედვით, რომლებიც არტისტულ ხედვას უკავშირდება, მსაჯი დავალებას აძლევს მანქანას და შემდეგ მის ნამუშევარს აფასებს. დავალება მოიცავს მითითებას რომელიმე ხელოვანის სტილში ხატვის თაოაბზე, მაგალითად: მონეს მსგავსი პეიზაჟები ან დეივ ბრუბეკის სტილში შესრულებული ჯაზის საღამო.

“გამვლელი მე-ს მოგონებები”. მარიო კლინჯმანი. 2018

“მხატვარ” ნეირონულ ქსელებზე ცნობილი AI არტისტი მარიო კლინჯმანი მუშაობს. მისი ყველაზე გამორჩეული ნამუშევარი სალვადორ დალის, მაქს ერნსტის და ენდი უორჰოლის ნამუშევრებთან ერთად გამოიფინა. ეს არის ნეირონული ქსელი, რომელიც რეალურ დროში თავად აწარმოებს ქალისა და კაცის პორტრეტებს მე-19 საუკუნის მხატვრების სტილში. მარიო კლინჯმანთან პირად ინტერვიუს შეგიძლია ამ სტატიაში გაეცნო.

გამოგვყევი ფეისბუკზე და გაიგე, რა ხდება დღეს ტექნოლოგიების ინდუსტრიაში!

თუ გაქვს სტატიის იდეა ტექნოლოგიებსა და მეცნიერებებთან დაკავშირებით, რომელსაც დიდი სიამოვნებით გაუზიარებდი ჩვენს მკითხველს, მოგვწერე ფეისბუკის მესენჯერში!

ასევე გაეცანი:

როგორ გვიმარტივებს ყოველდღიურობას AI ჩვენდა შეუმჩნევლად

როგორ ზომავენ, რამდენად ადამიანურია მანქანა? was originally published in ტექნოლოზი on Medium, where people are continuing the conversation by highlighting and responding to this story.

შესვლა

როგორ ზომავენ, რამდენად ადამიანურია მანქანა?

Recommended Posts

Moor

ტურინგის ტესტი და მისი ალტერნატივები

როგორ ატარებენ ტურინგის ტესტს?

მოახერხა თუ არა ვინმემ (ან, უფრო სწორად, რამემ) ტურინგის ტესტის ჩაბარება?

ტურინგის ტესტის ალტერნატივები

ვინოგრადის სქემის გამოწვევა (Winograd Schema Challenge)

მარკუსის ტესტი

ლავლეისის ტესტი 2.0

Share on other sites

Please sign in to comment

Who's Online 18 all people including: 2 წევრი, 3 ანონიმური, 13 ვიზიტორი სრულად ნახვა