წარმოიდგინეთ ბავშვობის მოგონება – რეალური და ნოსტალგიური, მაგრამ თითქოს ხელიდან რომ გისხლტებათ. იქნებ ეს ოჯახური ვიზიტია ზღვის სანაპიროზე, საქანელაზე გატარებული წუთები, ან სულაც ოთხფურცლა სამყურას ძიებაში გატარებული შუადღე. ახლა კი წარმოიდგინეთ, რომ ამ ძვირფასი მომენტის ბოთლში მოთავსება და სურნელად ქცევა შეგიძლიათ. სწორედ ამაზე მუშაობს მასაჩუსეტსის ტექნოლოგიური ინსტიტუტის MIT მეცნიერი საირუს კლარკი. მკვლევართა გუნდთან ერთად, მან შეიმუშავა აპარატი, სახელწოდებით Anemoia Device. ის გენერაციულ ხელოვნურ ინტელექტს იყენებს, რათა საარქივო ფოტოები გააანალიზოს, აღწეროს ისინი და მომხმარებლის მითითებების საფუძველზე უნიკალურ არომატებად გარდაქმნას.
ტერმინი „ანემოია“ – anemoia – მწერალ ჯონ კენიგს ეკუთვნის, რომელიც მან 2021 წელს გამოცემულ წიგნში, „ბუნდოვანი სევდის ლექსიკონში“ გამოიყენა. ეს სიტყვა აღნიშნავს ნოსტალგიას იმ დროის ან ადგილის მიმართ, რომელიც ადამიანს თავად არასდროს გამოუცდია – და კლარკის გუნდიც ზუსტად ამ სპეციფიკური შეგრძნების დაჭერას ცდილობს. როგორც მკვლევრები განმარტავენ, მოწყობილობა იკვლევს „გაფართოებული მეხსიერების“ კონცეფციას, ანუ იდეას, რომ ციფრულ ეპოქაში მეხსიერება სულ უფრო მეტად ინახება გარე მედიაში, ციფრული არქივების სახით.

როგორ მუშაობს „ანემოიას“ მანქანა?
ვიზუალურად მოწყობილობა რეტრო სამეცნიერო-ფანტასტიკური ფილმის კოსმოსური ხომალდის სამედიცინო განყოფილების ნივთს ჰგავს. ეს არის თხელი, ლითონისა და პლასტმასის კონსტრუქცია ნეონის მწვანე ეკრანით, სამი მარტივი ციფერბლატით და მინის კოლბით, სადაც საბოლოო სურნელი გროვდება.
პროცესი მარტივად იწყება: მომხმარებელი მოწყობილობაში ფოტოს ათავსებს. ჩაშენებული ხედვისა და ენის მოდელი (VLM) აანალიზებს გამოსახულებას და ქმნის პირველად აღწერას. მაგალითად, ჩინეთის ფოტოს შემთხვევაში, მან შეიძლება დაწეროს: „ტურისტი შავ შორტებში და ბავშვი ჩინეთის დიდი კედლის შესასვლელთან დგანან, ქვის საფეხურებისა და მთიანი პეიზაჟის ფონზე“.
ამის შემდეგ საქმეში მომხმარებელი ერთვება. სამი ციფერბლატის საშუალებით მას შეუძლია დაარეგულიროს პარამეტრები: პირველით ირჩევს, ვინ ან რა უნდა იყოს სუბიექტი, მეორით განსაზღვრავს სუბიექტის ასაკს, მესამით კი – სცენის განწყობას.
როგორც საირუს კლარკი აღნიშნავს, მისი მიზანი გენერაციული AI-ისთვის ახალი ფიზიკური ინტერფეისების შექმნა იყო. ჩვეულებრივ, გენერაციული AI „ცარიელი პრომპტით“ იწყება, აქ კი ციფერბლატები ამას ფიზიკური, გასაგები გრამატიკით ანაცვლებს. მისი თქმით, ეს არ ჰგავს ალგორითმთან საუბარს და სწორი სიტყვების შერჩევას, ეს უფრო მუსიკალური ინსტრუმენტის აწყობას ჰგავს.
ChatGPT-4o-ზე დაფუძნებული ენობრივი მოდელი პირველად აღწერასა და მომხმარებლის ინპუტს აერთიანებს და მოკლე, პოეტურ ნარატივად აქცევს. მაგალითად, თუ სუბიექტად თავად ჩინეთის დიდ კედელს ავირჩევთ, შედეგი შეიძლება ასეთი იყოს: „საუკუნეების განმავლობაში, მეომარ სამეფოებთან ბრძოლიდან მინგის დინასტიამდე, სიხარულით ვაკვირდებოდი დროის სვლას და უამრავ მოგზაურს ჩემს ქვის, აგურისა და ხის ბილიკებზე“.

სურნელი, როგორც მეხსიერების პორტალი
შემდეგ დგება ყველაზე შთამბეჭდავი ეტაპი – პოეზიის ხელშესახებ სურნელად გარდაქმნა. სურნელის შექმნის პროცესი არა მხოლოდ შესაბამისი ნოტების იდენტიფიცირებას, არამედ სწორი ემოციების გამოწვევას ეფუძნება.
გუნდმა მოდელი გაწრთვნა, რათა მას არჩევანი 50-მდე სხვადასხვა არომატისგან შემდგარი ბიბლიოთეკიდან გაეკეთებინა. კოლექცია მოიცავს ყველაფერს – ძველი წიგნებიდან დაწყებული, ტყავითა და მიწით დამთავრებული. თითოეული არომატი კოდირებულია დეტალებით: ძირითადი ნოტებით, ასოცირებული კონცეფციებითა და ემოციებით. ენობრივი მოდელი ირჩევს საჭირო არომატებს და განსაზღვრავს მათ დოზირებას.

ოთხი ტუმბო საჭირო სითხეს კოლბაში უშვებს. ჩინეთის დიდი კედლის შემთხვევაში, სურნელი მოიცავდა კოცონის, მიწის, კედრისა და ბამბუკის ნაზავს. Anemoia Device-ს შეუძლია შექმნას თითქმის უსასრულო დიაპაზონის სურნელები, იქნება ეს 80-იანების ცხელი ზაფხულის ქვიშიანი სანაპირო თუ ბაღში მსხლის მირთმევის მომენტი.
წყარო: Fastcompany, www.marketer.ge