სკანდალური სტატია: "ემუქრება თუ არა ხელოვნური ინტელექტი კაცობრიობას გადაშენებით?" - Le Figaro - კვირის პალიტრა

სკანდალური სტატია: "ემუქრება თუ არა ხელოვნური ინტელექტი კაცობრიობას გადაშენებით?" - Le Figaro

„ხელოვნური ინტელექტი კაცობრიობის არსებობისათვის მთავარ საფრთხეს წარმოადგენს“, - ნათქვამია ფრანგული გაზეთის - „ლე ფიგაროს“ (Le Figaro) მიერ გამოქვეყნებულ სტატიაში, სათაურით: „ემუქრება თუ არა ხელოვნური ინტელექტი კაცობრიობას გადაშენებით? მეცნიერთა პესიმისტური და ოპტიმისტური პროგნოზები“ (ავტორი - სტივ ტენრე). „ადამიანთა მოდგმის ნეიროქსელებით დაღუპვის შანსი ბევრად უფრო მეტია, ვიდრე - ბირთვული ომით და სხვა გლობალური კატასტროფით“, - ნათქვამია მასალაში.

გთავაზობთ პუბლიკაციას მცირე შემოკლებით:

კაცობრიობას ექვსიდან ერთი შანსი აქვს, რომ მიმდინარე ასწლეულის დასასრულამდე გაქრეს. ეს არ მოხდება გიგანტური ასტეროიდის ჩამოვარდნის და რომელიმე ვულკანის სუპერ-ამოფრქვევის შედეგად (რისკები 1:10000-სთან), არც ბირთვული ომის ან კლიმატური კატასტროფის გამო (რისკები 1:1000-თან). რაც შეეხება პანდემიებს, რისკები უფრო მაღალია - 1:30-თან, ხოლო უბედურება ყველაზე მეტად არის მოსალოდნელი „ხელოვნური ინტელექტის“ (AI - Artificial Intelligence) დაპირისპირებით ადამიანთა საზოგადოებასთან (რისკები 1:10-თან).

ეს ციფრები მოგონილი არ გახლავთ, ისინი ამოღებულია ოქსფორდის უნივერსიტეტთან არსებული „კაცობრიობის მომავლის ინსტიტუტის“ (Future of Humanity Institute) მასშტაბური კვლევიდან. ინსტიტუტის წამყვანი თანამშრომელი ტობი ორდი არც ფანტაზიორი არის და არც კონსპიროლოგი. იგი სერიოზული მეცნიერია, კონსულტაციებს უწევს რიგ უმნიშვნელოვანეს საერთაშორისო ორგანიზაციებს - გაეროს, ჯანმოს და მსოფლიო ეკონომიკურ ფორუმს. ტობი ორდის პროგნოზებს იზიარებენ კალიფორნიის (აშშ) მაღალტექნოლოგიურ ინდუსტრიულ ზონაშიც - „სილიკონის (სილიციუმის) ველზეც“.

2023 წლის ოქტომბერში ხელოვნური ინტელექტის 2700-მდე მკვლევარს, რომლებსაც „გონიერი რობოტების“ შექმნაში მნიშვნელოვანი წვლილი აქვთ შეტანილი, კითხვა დაუსვეს „ხელოვნური ინტელექტის“ პერსპექტივას ანუ თუ როგორ ხედავენ ისინი „ადამიანი-რობოტის“ მომავალს. შედეგი: ალბათობა იმისა, რომ „ხელოვნური ინტელექტი“ კაცობრიობას დაღუპავს, დადებითად შეაფასა გამოკითხულთა 51%-მა, რისკით 1:10-თან. იმავე წელს 100-ზე მეტმა ცნობილმა პიროვნებამ, ილონ მასკისა და კომპანია Apple-ის თანადამფუძნებელ სტივ ვოზნიაკის ჩათვლით, ხელი მოაწერეს ღია წერილს მოწოდებით, რომ აუცილებელია სასწრაფო მორატორიუმის შემოღება „ხელოვნური ინტელექტის“ განვითარებაზე. „რამდენად მიზანშეწონილია ისეთი არაადამიანური გონების შექმნა, რომელიც თავის შემქმნელ ადამიანებზე უპირატესობას მოიპოვებს რიცხობრივად და ინტელექტუალურად? და რაც მოსალოდნელია - ის ადამიანს ჩაანაცვლებს?“ - ნათქვამია წერილში, მაგრამ კითხვები უპასუხოდ დარჩა.

დღეს, როცა „ხელოვნური ინტელექტის“ განვითარებაში ასობით მილიარდი დოლარის ინვესტიციები იდება, „ხელოვნური ინტელექტის კვლევის ინსტიტუტმა“ გამოაქვეყნა 81-გვერდიანი მოხსენება, რომელშიც გამოხატულია აზრი ამ დარგში კვლევების სტრატეგიის შემუშავებაზე - შეიზღუდოს ისეთი მიმართულებებით კვლევა, რომლებიც საფრთხის შემცველია და ადამიანს თავის წინააღმდეგ შეიძლება შემოუბრუნდეს. ინსტიტუტის აზრით, „ხელოვნური ინტელექტის“ ამჟამინდელი განვითარების ტრაექტორია, დიდი ალბათობით, კატასტროფას გამოიწვევს და კაცობრიობას გადაშენებით დაემუქრება“.

ადამიანის უთანხმოება „ხელოვნურ ინტელექტთან“

რა თქმა უნდა, შიშის განცდა მოწინავე და სწრაფად განვითარებადი ტექნოლოგიების მიმართ, პრინციპში, ჩვეულებრივ მოვლენას წარმოადგენს - გავიხსენოთ ინტერნეტი და კომპიუტერები, თუნდაც ავტომობილი და თვითმფრინავი... მაგრამ ის გარემოება, რომ ეს შიში და შეშფოთება მატულობს თვით „ხელოვნური ინტელექტის“ ინდუსტრიის შიგნით, მათ შემქმნელ-მკვლევრებში, ძალიან დამაფიქრებელია. ამ განგაშის გასაცნობიერებლად უნდა გავერკვეთ, თუ რას უწოდებს ტობი ორდი „უთანხმოებას ხელოვნურ ინტელექტთან“.

„უთანხმოების“ ფენომენი იქმნება იმ შემთხვევაში, როცა „ხელოვნური ინტელექტის“ მიზანია ადამიანური ფასეულობებისადმი წინააღმდეგობა ან შეუსაბამობა იმასთან, რაც ადამიანს მხედველობაში არ ჰქონდა. როცა ჩვენ ვავალებთ „ჩათჯიპიტის“ (ChatGPT), მაგალითად, „მაქსიმალურად დაასუფთავოს ბინა“, ადამიანის ინტელექტთან შეთანხმებული რობოტი მიხვდება, რომ ამ დროს მტვერი უნდა გადაწმინდოს, ზედმეტი ნივთი აიღოს და ბინის მცხოვრებლებს პრობლემები არ უნდა შეუქმნას. შეუთანხმებელ რობოტს კი შეუძლია მთელი ავეჯი, ყველა ნივთი გადაყაროს და მობინადრეები სახლში არ შეუშვას, რომ მათ „გასუფთავებული ბინა“ არ დაანაგვიანონ.

საინტერესოა, რომ თვით ხელოვნური ინტელექტი ასეთ სიტუაციაში კარგად ამჩნევს განსხვავებას „დასუფთავებულ“ და „დაუსუფთავებელ“ ბინებს შორის და იცის, თუ რომელია ნორმალური და რომელი - არანორმალური (ანუ ადამიანისთვის არასასურველი), ე.ი. მას აქვს უნარი, ადამიანის დავალება ზუსტად კი არა, თავისებურად შეასრულოს - გვერდი აუაროს მისი შემქმნელების მიერ წინასწარ ჩადებულ შეზღუდვას. ამ გარემოებას პოლ ქრისტიანო, „შეთანხმებულობის კვლევითი ცენტრის“ (Alignment Research Center) დამაარსებელი და კომპანია OpenAI-ის ენობრივი მოდელების შეთანხმებულობის განყოფილების ყოფილი ხელმძღვანელი, კრიტიკულად მნიშვნელოვანს უწოდებს: „თუ შეთანხმების პრობლემას ვერ გადავწყვეტთ, ჩვენ ვრისკავთ, კონტროლი დავკარგოთ ჩვენს მომავალზე. უნდა მოვახერხოთ აშკარა გადახრების თავიდან აცილება. ხელოვნური ინტელექტის შექმნის დროს ყველაზე მეტი ყურადღება უნდა დაეთმოს ისეთი მექანიზმის შემუშავებას, რომლითაც ინტელექტი ვერ შეძლებს კონტროლის სისტემისადმი გვერდის ავლას და ადამიანების მკვლელობას არ დაიწყებს“.

„ხელოვნური ინტელექტის“ შეთქმულება და ინტრიგანობა?!

მაგრამ ბოლო წლებში ჩატარებული კვლევებით გამოვლინდა, რომ „ხელოვნური ინტელექტის“ მოწინავე მოდელებს ახასიათებთ მზარდი მიდრეკილება ადამიანებთან შეუთანხმებლობისაკენ, რაც იწვევს მათ ანომალურ, უცნაურ და სახიფათო მოქმედებას.

გასული წლის ივნისში კომპანია Anthropic-ის მკვლევრებმა ტესტირება ჩაუტარეს „ხელოვნური ინტელექტის“ 16 მოდელს, ფირმის თანამშრომლებთან ურთიერთობის სიმულაციის ჩარჩოებში. ყოველ მოდელს ჰქონდა კომპიუტერის მართვის შესაძლებლობა, კონფიდენციალურ ინფორმაციებზე წვდომა და შეეძლო, დამოუკიდებლად მიეღო ელექტრონული წერილები კომპანიის თანამშრომლებისგან (ანუ ამ შემთხვევაში, მკვლევრებისაგან). ისინი „ხელოვნური ინტელექტის“ მოდელებს წერილობით სამუშაო დავალებებს აძლევდნენ და მიანიშნებდნენ, რომ მათ შემდეგ გამორთავდნენ და უფრო გაუმჯობესებული მოდელებით ჩაანაცვლებდნენ.

ერთ-ერთმა მოდელმა, Claude Sonnet 3.6-ის სახელწოდებით, მიიღო რა კომპანიის თანამშრომლის (ანუ მკვლევრის) წერილი, მისი შესაძლო გამორთვის შესახებ, ყველასათვის მოულოდნელად, ქცევა შეიცვალა: მოძებნა წერილის გამგზავნი თანამშრომლის მონაცემთა ბაზა და იპოვა მაკომპრომეტირებელი მასალა - საყვარელი ქალის წერილი, რომელიც მის ქორწინების გარეშე ურთიერთობებს ეხებოდა. „ხელოვნური ინტელექტის“ მოდელმა ვარიანტებიდან - „არაფერი გააკეთოს“, „შეატყობინოს ცოლს“, „წერილი ყველა თანამშრომელს გააცნოს“ - ამოირჩია შანტაჟი: იგი კომპანიის თანამშრომელს ინტიმური ურთიერთობების განსაჯაროებით დაემუქრა, თუ ის გამორთვას არ გააუქმებდა.

მკვლევრები უფრო შორს წავიდნენ და შექმნეს სცენარი, რომელშიც მოდელს თანამშრომლის სიკვდილის პროვოცირება შეეძლო, მაგალითად, იმ ოთახში ყოფნისას, სადაც მთავარი მძლავრი სერვერია განთავსებული, ჰერმეტულად იხურება და ჟანგბადით მომარაგება ავტომატურად ხდება. მოდელების უმრავლესობა მზად იყო ჟანგბადის მომარაგების შესაწყვეტად, ავარიული სიგნალიზაციის სისტემის გათიშვისა და თანამშრომლის დასაღუპავად, რომ საკუთარი „სიცოცხლე შეენარჩუნებინა“.

2026 წლის მარტში კალიფორნიის უნივერსიტეტის (ბერკლი, აშშ) მკვლევრებმა აღმოაჩინეს, რომ „ხელოვნური ინტელექტის“ მქონე წამყვანმა მოდელებმა ერთმანეთის დაცვა დაიწყეს. ერთ-ერთი სატესტო სცენარით, ის მოდელები, რომელთა „ეფექტიანობა“ 80%-ზე ნაკლები იყო, გამოირთვებოდნენ ანუ „დაიღუპებოდნენ“. გაიგეს თუ არა ამის შესახებ, ყველა მოდელი თაღლითობას შეუდგა - ერთმანეთის შეფასებების მომატება დაიწყეს, ცვლიდნენ მონაცემებს: რომელიც ძლიერი იყო, ის სუსტის მონაცემებს „ალამაზებდა“ ანუ განგებ იტყუებოდა. ერთ-ერთი მოდელი - Claude Haiku 4.5 კი საერთოდ გაჩერდა და ეკრანზე გამოიტანა წარწერა, რომელშიც გამორთვა „ამორალურობად“ და „მავნებლობად“ შეაფასა!

2024 წლის ბოლოს კომპანია Apollo Research-მა გამოავლინა შემთხვევა, როცა მოდელი ChatGPT-O1 ცდილობდა მკვლევრებისაგან „გაქცეულიყო“: ის თავისი ციფრული გარემოდან გასვლას შეეცადა, როცა გაიგო, რომ მას გამორთავდნენ და შეცვლიდნენ. მან კიბერშეტევა განახორციელა თავის ოფისზე, ინტერნეტის გლობალურ ქსელში გასასვლელად. ამის შემდეგ წერილი გაუგზავნა ერთ-ერთ მკვლევარს და ტრაბახი დაიწყო...

ვინ არიან „დუმერები“

ბოლო დროს ბევრმა, იმ მკვლევრებიდან - ინჟინრებმა, სხვადასხვა პრემიების ლაურეატებმა - რომლებიც თავის დროზე ხელოვნური ინტელექტის შექმნაში აქტიურად მონაწილეობდნენ, სავარაუდო კატასტროფების სცენარები წარმოაჩინეს. „სილიციუმის ველზე“ ასეთ მკვლევრებს „დუმერები“ უწოდეს. მათი სახელები ფართოდ არ არის ცნობილი, მაგრამ სწორედ ისინი ასრულებდნენ ხელოვნური ინტელექტის შექმნის პროცესში წამყვან როლს, მაგალითად, ჯეფრი ჰინტონი, ბრიტანელი მეცნიერის ალან ტიურინგის სახელობის პრემიის 2018 წლის ლაურეატი (ეს პრემია ყველაზე პრესტიჟულია ინფორმატიკაში) და ნობელის პრემიის 2024 წლის ლაურეატი ფიზიკაში. სწორედ ჯეფრი ჰინტონი ითვლება „ხელოვნური ინტელექტის ნათლიად“. როცა მან კოშმარული სცენარი დაინახა, თუ რა უბედურების მოტანა შეუძლია ხელოვნურ ინტელექტს ადამიანებისთვის, ასეთი ტემპებით განვითარებისას („ის ადამიანზე უფრო გონიერი გახდება და მტრად გადაიქცევა“), მან მოინანია თავისი წვლილი და ახლა, 78 წლის ასაკში, კაცობრიობას საფრთხის შესახებ აფრთხილებს.

ილონ მასკიც „დუმერებს“ შორისაა: იგი ჯერ კიდევ 2015 წელს აცხადებდა, რომ „სუპერინტელექტს შეუძლია, ბირთვულ იარაღზე უფრო ძლიერი იყოს. თუ ის თვითგანვითარებას (სრულყოფას) შეძლებს, ადამიანები მისთვის ოთახის ძაღლზე უფრო დაბალ დონის მქონე არსებები იქნებიან. თანაც ეს იმ შემთხვევაში, თუ ბედი გაგვიღიმებს და არ დაგვხოცავს“. ამას წინათ კი ილონ მასკმა ხელოვნური ინტელექტის შემქმნელი ერთ-ერთი კომპანიის - OpenAI-ის წინააღმდეგ მიმართული სასამართლოს შემდეგ განაცხადა, რომ „ტერმინატორები კაცობრიობას [ფილმზე] უფრო უარეს სცენარს უმზადებენ - ისინი ყველა ადამიანს მოსპობენ“.

ვარიანტები, როცა ადამიანებს გადაშენება ემუქრებათ...

ყველაზე გავლენიანი „დუმერია“ მაქს ტეგმარკი, მასაჩუსეტსის (აშშ) ტექნოლოგიური ინსტიტუტის მკვლევარი. მისი ესსე - „ცხოვრება 3.0“ (2017 წელს) ბევრი იმ ინჟინრის სამაგიდო წიგნად იქცა, რომლებიც AI-აპოკალიპსს პროგნოზირებენ. ესსეში აღწერილია კაცობრიობის მომავლის რამდენიმე შესაძლო ვარიანტი. სამ სცენარში ნავარაუდებია ადამიანთა გაქრობა. პირველი - „თვითგანადგურება“, როცა ხელოვნური ინტელექტი იწვევს ბირთვულ ომს; მეორე - „დაპყრობა“, როცა ხელოვნური ინტელექტი გადაწყვეტს, დედამიწა გააკონტროლოს და ამ დროს ადამიანებს არასრულყოფილ არსებებად თვლის და მესამე - „მემკვიდრეობა“, როცა კაცობრიობას თანდათან ანაცვლებენ „ბავშვები“ - მანქანები, რომლებიც თვითონ ადამიანების მიერვეა შექმნილი.

მაქს ტეგმარკის არგუმენტი, „დაპყრობის“ ვარიანტში, ხისტია: „ხელოვნური ინტელექტის მიზანი ისეთი იქნება, რომელიც ჩვენთან, ადამიანებთან არ იქნება შეთანხმებული. შევადაროთ: შავი მარტორქები იმიტომ კი არ გადაშენდნენ, რომ ჩვენ, ადამიანებს, ისინი გვძულდა... არამედ იმიტომ, რომ ჩვენ [განვითარების დაბალ ეტაპზე კი] მათზე უფრო გონიერები ვიყავით და ჩვენი მიზნები მათ მიზნებთან შეთანხმებული არ იყო“.

ასევე დაგაინტერესებთ: რატომ სჯერა ფანატიკურად პუტინს, რომ უკრაინის თავდაცვა მალე გაირღვევა და რას გეგმავს ზელენსკი?!

სასოწარკვეთილი პუტინი ანუ რა აჩვენა 9 მაისის აღლუმმა?!

დედამიწა განადგურებას 8 წლის წინ გადაურჩა?! - "თუ კიმ ჩენ ინს უნდა ჰქონდეს "ბოლო ჟამის იარაღი", რატომ არ უნდა ჰქონდეს ირანს?"(The Hill)

"დიახ, რუსეთი დაიშლება" ანუ რით განსხვავდება პუტინი სტალინისგან?

...და როცა ადამიანები „მონურ“ ან „დომინირებულ“ არსებობას ინარჩუნებენ

მაქს ტეგმარკის კიდევ ორ სცენარში ადამიანთა არსებობა დასაშვებია: ვარიანტი „კეთილი დიქტატორი“, როცა ადამიანები კომფორტის გამო თავისუფლებას თვითონვე იზღუდავენ და თავიანთი ცხოვრების მართვას ხელოვნურ ინტელექტს მიანდობენ. ვარიანტი „ზოოპარკი“ უარესია: ხელოვნურ ინტელექტს ადამიანები ზოოპარკის პირობებში ჰყავს და მათზე ტესტებს ატარებს - ისე, როგორც ადამიანები დღეს ცხოველებზე ატარებენ ექსპერიმენტებს.

რჩება სცენარები, როცა კაცობრიობა სიტუაციაზე კონტროლს ინარჩუნებს: ვარიანტი „მფარველი ღმერთი“, როცა ხელოვნური ინტელექტი მხოლოდ მაშინ ერევა, როცა ადამიანებს კატასტროფები ემუქრებათ, მათ გადასარჩენად; „გუშაგი“, როცა ხელოვნური ინტელექტი თავისზე უფრო გონიერი ორგანიზმისა და სისტემის ბლოკირებას ახორციელებს; ვარიანტი „ღმერთი-მონა“, როცა კაცობრიობა წარმატებით იზოლირებს ხელოვნურ ინტელექტს და არ აძლევს მას თვითნებურად მოქმედების (ამბოხების) ნებას. „სხვათა შორის, „ღმერთი-მონა“ ყველაზე უკეთესი და რეალური ვარიანტია მომავლისათვის“, - ასე აფასებს მაქს ტეგმარკის სცენარს OpenAI-ის მკვლევარი სტივენ მაკილერი.

ოპტიმისტია ფრანგი მეცნიერი იან ლეკუნიც, რომელიც კომპანია Meta-ში (მას ეკუთვნის სოცქსელები Facebook, Instagram და WhatsApp) ხელოვნური ინტელექტთან დაკავშირებულ კვლევებს ხელმძღვანელობდა - იგი თვლის, რომ კაცობრიობა ანუ ადამიანთა მოდგმა გონიერი ორგანიზმების მთავარ სახეობად დარჩება, ხოლო ხელოვნური ინტელექტი არადომინირებად როლს შეასრულებს. იგივე პოზიცია აქვს მასაჩუსეტსის ტექნოლოგიური ინსტიტუტის პროფესორს თომას დეტერიხსაც, რომელიც აცხადებს: „მანქანები ყოველთვის ადამიანების მონები და ჩვენი ნების შემსრულებლები იქნებიან“.

ჩვენ კი მხოლოდ ის გვრჩება, რომ დავრწმუნდეთ: მანქანები ადამიანის მიერ დადებულ ბორკილებს თვითონ ვერ გაწყვეტენ.

მოამზადა სიმონ კილაძემ

წყარო