როგორ სწავლობენ სისტემები სურათებისა და ტექსტის დამოუკიდებლად შექმნას?

Moor · 18 ოქტომბერი, 2020

რა არის და როგორ მუშაობს მწარმოებელი მოქიშპე ქსელები (GANs)

Ხელოვნური ინტელექტის გაწვრთნა განვითარების საწყის სტადიაზეა და ამ მიზნით შემუშავებული მოდელები ჯერ კიდევ განიცდის გაუმჯობესებას. ჩნდება ახალი მიმართულებები, ახალი მექანიზმები, ახალი მეთოდები. დღეს ისეთ დონეს მივაღწიეთ, როცა მანქანის მიერ გენერირებულ ტექსტებსა თუ სურათებს ხშირად რეალურისგან ვეღარ ვარჩევთ. მექანიზმი, რომლის დამსახურებითაც ამ შედეგს მივაღწიეთ GANs-ის სახელითაა ცნობილი. GANs იშიფრება, როგორც Generative Adversarial Networks, იგივე — მწარმოებელი მოქიშპე ქსელები.

რა არის მწარმოებელი მოქიშპე ქსელები?

ეს მოდელი სიღრმისეული სწავლების მექანიზმია, რომელიც ზედამხედველის გარეშე სწავლობს. ზოგადად, ხელოვნური ინტელექტი (უფრო ზუსტად კი, მანქანური სწავლება) სამი ტიპის დასწავლის მოდელს იყენებს: სწავლა ზედმახვედველით, სწავლა ზედამხედველის მსუბუქი ჩართულობით და სწავლა ზედამხვედველის გარეშე. მწარმოებელი მოქიშპე ქსელები საინტერესოა იმით, რომ ის ზედამხედველის გარეშე სწავლობს და, ამასთან ერთად, ყველაზე ეფექტიანი მოდელია, რაც კი გვინახავს.

მწარმოებელი მოქიშპე ქსელების შემქმნელი იან გუდფელოუა (ინგლისურად უფრო მაგარი გვარი აქვს), რომელმაც მექანიზმის შესახებ ნაშრომი 2014 წელს გამოაქვეყნა კოლეგებთან ერთად. მას შემდეგ, სისტემამ დიდი ინტერესი დაიმსახურა და დღეს ის ყველაზე დახვეწილ მექანიზმად ითვლება.

ტერმინებმა არ შეგაშინოს, მმქ (ანუ GANs) ძალიან მარტივი მექანიზმია (ასახსნელად, რა თქმა უნდა). ეს არის ორი ნეირონული ქსელისგან შემდგარი სისტემა, რომლებიც ერთმანეთთან შეჯიბრების ხარჯზე სწალობენ და ვითარდებიან.

საწყის ეტაპზე, ქსელებს ‘აჭმევენ’ მონაცემებს, მაგალითად, ადამიანების სახეების სურათებს. შემდეგ, ერთ-ერთი ქსელი, რომელსაც მწარმოებელი ეწოდება, აგენერირებს სურათს მიწოდებულ სურათებზე დაყრდნობით. მეორე ქსელი, რომელსაც დეტექტორი, ან დისკრიმინატორი, ეწოდება, ცდილობს გამოიცნოს სურათი ნამდვილია თუ პირველი ქსელის მიერ წარმოებული. შედეგების მიხედვით ქსელები ყოველ ჯერზე ხვეწენ საკუთარ თავს მანამ, სანამ ნამდვილსა და ქსელის მიერ წარმოებულ სურათებს შორის განსხვავების აღმოჩენა შეუძლებელი არ გახდება. სულ ესაა.

აქ საინტერესო დეტალი ისაა, რომ ქსელები ერთმანეთს ეხმარებიან გაუმჯობესებაში. როცა მწარმოებელი ქსელი დეტექტორს სურათს აჩვენებს, ეს უკანასკნელი, პასუხის გაცემის შემდეგ, მიუთითებს მის მიერ დაშვებულ შეცდომებზე და ურჩევს, როგორ გააუმჯობესოს შედეგები შემდეგისთვის. ფაქტობრივად, ქსელები ფიდბექზე დაფუძნებულ სწავლების მეთოდს იყენებენ, რაც ფართოდ გავრცელებული პრაქტიკაა დღევანდელი განათლების სისტემაში. მათი დიალოგი რომ ჩვენს ენაზე ვთარგმნოთ, დაახლოებით ასე წარიმართებოდა:

მწარმოებელი: აი, სახის სურათი. წინა სახის სურათებთან შედარებით, რამდენად რეალისტურია ის?

დეტექტორი: საკმაოდ რეალისტურია, მაგრამ თან წარმოებულსაც გავს. (0.4% ალბათობა იმისა, რომ ნამდვილი სურათია) დარწმუნებული არ ვარ, მაგრამ ალბათ, წარმოებული სურათია.

მწარმოებელი: მართალია! წარმოებული სურათია. როგორ დავხვეწო, რომ უფრო რეალურს გავდეს?

დეტექტორი: ერთი წამით, დავფიქრდე. (უკანა პლანზე გამოთვლებს აწარმოებს) მგონი, სახეს თვალები უნდა დაუმატო. სახის სურათებს თვალები აქვს ხოლმე.

მწარმოებელი: მიღებულია.

ამ ‘დიალოგის’ შემდეგ ორივე ქსელი ხვეწს საკუთარ თავს. მწარმოებელი იმახსოვრებს, რომ სახის სურათებს თვალები უნდა დაურთოს, დეტექტორი კი ამცირებს ალბათობას იმისა, რომ უთვალებო სურათი რეალური იქნება (თუ მანამდე ასეთ სურათს 0.4%-ს ანიჭებდა, ახლა 0.39%-ს მიანიჭებს). ეს პროცესი გაგრძელდება მანამ, სანამ დეტექტორის პასუხები სუფთა ალბათობაზე დავა და მას არ ექნება არანაირი არგუმენტი სურათის რეალურად ან წარმოებულად მიჩნევისთვის. ეს ის ეტაპია, რომელზეც ქსელების წვრთნა უნდა შეწყდეს. გილოცავ! შენ მიიღე სისტემა, რომელმაც დამოუკიდებლად ისწავლა რეალისტური სურათების გენერირება!

მწარმოებელი მოქიშპე ქსელების მაგალითები

მწარმოებელ მოქიშპე ქსელებს იყენებენ როგორც სურათების, ისე ტექსტის და ვიდეოების გენერირებისთვის.

სურათები სურათებიდან

მივაწოდოთ მმქ-ს სათვალეებიანი კაცების სურათები. შემდეგ კი ასეთი დავალება მივცეთ: გამოაკელი ამ სურათებს უსათვალო კაცები და დაუმატე უსათვალო ქალები, რას მივიღებთ? ის ავტომატურად დააგენერირებს ქალებს სათვალეებით.

ტექსტიდან სურათი

არსებობს ონლაინ პლატფორმა, რომელიც მიცემული ტექსტის ხარჯზე სურათებს აგენერირებს. მართალია, სურათები გადღაბნილი და, ხანდახან, არასწორია, მაგრამ ის ფაქტი, რომ ასეთი რაღაც უკვე არსებობს უყურადღებოდ დასატოვებელი არაა.

ტექსტიდან ტექსტი — ყველაზე დახვეწილი მწარმოებელი მოქიშპე ქსელები

ილონ მასკი რომ ყველა მიმართულების მომავლის ტექნოლოგიებს უდგას სათავეში, მგონი, აღარვის გვიკვირს. მისი ერთ-ერთი ნაკლებად ცნობილი (მაგრამ, არანაკლებ წარმატებული) კომპანიაა OpenAI, რომელიც ხელოვნური ინტელექტის მიმართულებით მუშაობს. სწორედ OpenAI-ს ეკუთვნის ყველაზე დახვეწილი მწარმოებელი მოქიშპე ქსელები, რომელიც სალაპარაკო ენის დამუშავებაზეა გაწვრთნილი და რომელიც GPT-ის სახელითაა ცნობილი.

სისტემის შესაძლებლობების კარგი გასართობი დემონსტრაციაა თამაში AI Dungeon, სადაც, ფაქტობრივად, ავითარებ სიუჟეტს ხელოვნურ ინტელექტთან ერთად. შენ ირჩევ ჟანრს და პერსონაჟს, შემდეგ კი, შენ და სისტემა მონაცვლეობით წერთ სცენარის გაგრძელებას. უნდა ნახო, რომ დაიჯერო!

AI Dungeon-ი GPT-ის მეორე მოდელითაა შექმნილი. დიდი ხანი არაა, რაც GPT-3 გამოჩნდა, რომელსაც ტექსტის გენერირება სულ სხვა საფეხურზე აჰყავს. GPT-3 წერს მოთხრობებს, პოემებს, სიმღერებს და, დეველოპერების შემაშფოთებლად, კოდსაც კი.

GPT-3 იმდენად ძლიერია, რომ ის მარტივად აცურებს რიგით მოქალაქეებს. ერთ-ერთმა სტუდენტმა ტექნოლოგიების პოპულარულ ონლაინ პლატფორმა Hackernoon-ზე სრულიად GPT-3-ის მიერ გენერირებული ბლოგები გაუშვა, რომელთაგან ერთ-ერთი ნომერ პირველი ყველაზე წაკითხვადი სტატია გახდა. ამავე სისტემის მეშვეობით წარმოებული ბოტი კი ერთ კვირაზე დიდხანს წერდა პოსტებს Reddit-ზე, რომლებიც ყველას ნამდვილი ეგონა.

კონკრეტულად ამ სისტემაზე ცალკე სტატიას შემოგთავაზებთ.

როგორ ფიქრობ, რამდენად სასარგებლოა ჩვენთვის ასეთი სისტემების შექმნა და რას უნდა ველოდეთ მომავალში? გაგვიზიარე შენი აზრი კომენტარებში.

თუ გაქვს სტატიის იდეა ტექნოლოგიებსა და მეცნიერებებთან დაკავშირებით, რომელსაც დიდი სიამოვნებით გაუზიარებდი ჩვენს მკითხველს, მოგვწერე ფეისბუკის მესენჯერში! თან გვერდის მოწონებაც არ დაგავიწყდეს.

ასევე გაეცანი:

ნეირონული ქსელები — ყალბი ხელოვნება თუ ხელოვნების ახალი მედიუმი?

როგორ სწავლობენ სისტემები სურათებისა და ტექსტის დამოუკიდებლად შექმნას? was originally published in ტექნოლოზი on Medium, where people are continuing the conversation by highlighting and responding to this story.

შესვლა

როგორ სწავლობენ სისტემები სურათებისა და ტექსტის დამოუკიდებლად შექმნას?

Recommended Posts

Moor

რა არის და როგორ მუშაობს მწარმოებელი მოქიშპე ქსელები (GANs)

რა არის მწარმოებელი მოქიშპე ქსელები?

მწარმოებელი მოქიშპე ქსელების მაგალითები

სურათები სურათებიდან

ტექსტიდან სურათი

ტექსტიდან ტექსტი — ყველაზე დახვეწილი მწარმოებელი მოქიშპე ქსელები

Share on other sites

Please sign in to comment

Who's Online 13 all people including: 1 წევრი, 0 ანონიმური, 12 ვიზიტორი სრულად ნახვა