კომპანია Anthropic-მა ახალი, თავისი მომავალი ხელოვნური ინტელექტის მოდელის სატესტო ვერსიის გაშვების შესახებ განაცხადა. პროექტი, რომელსაც Project Glasswing უწოდეს, კრიტიკულ პროგრამულ ინფრასტრუქტურაში არსებული სისუსტეების აღმოჩენასა და აღმოფხვრას ისახავს მიზნად. ამ მასშტაბურ კოალიციაში ისეთი ტექნოლოგიური გიგანტები გაერთიანდნენ, როგორებიცაა Amazon, Apple, Broadcom, Cisco, CrowdStrike, Linux Foundation, Microsoft და Palo Alto Networks. ინიციატივის ფარგლებში, პარტნიორები ახალ მოდელს თავდაცვითი უსაფრთხოების მიზნებისთვის გამოიყენებენ და მიღებულ შედეგებს მთელ ინდუსტრიას გაუზიარებენ. გარდა ამისა, Anthropic წვდომას ანიჭებს კიდევ 40-მდე ორგანიზაციას, რომლებიც კრიტიკული პროგრამული ინფრასტრუქტურის შექმნასა და შენარჩუნებაზე ზრუნავენ.

ბოლო პერიოდში სულ უფრო იზრდება შიში იმის შესახებ, რომ ბოროტმოქმედებმა მძლავრი AI მოდელები, შესაძლოა, ბევრად უფრო დახვეწილი კიბერშეტევებისთვის გამოიყენონ. როგორც კომპანიის წარმომადგენლები განმარტავენ, მსოფლიო კიბერინფრასტრუქტურის დაცვას შესაძლოა წლები დასჭირდეს, მაშინ როცა ხელოვნური ინტელექტის შესაძლებლობები სულ რაღაც რამდენიმე თვეში მნიშვნელოვნად ვითარდება. სწორედ ამიტომ, კიბერდამცველების უპირატესობის შესანარჩუნებლად, დაუყოვნებლივი მოქმედებაა საჭირო. ამ მიზნის მხარდასაჭერად, Anthropic 100 მილიონი დოლარის ღირებულების მოდელის გამოყენების კრედიტებს გამოყოფს, ხოლო 4 მილიონ დოლარს პირდაპირი შემოწირულობის სახით გადასცემს ღია კოდზე მომუშავე უსაფრთხოების ორგანიზაციებს.

უსაფრთხოების მიმართულებით ამ ძლიერი პოტენციალის აღმოჩენა მაშინ მოხდა, როდესაც კომპანია ახალ მოდელს, Claude Mythos Preview-ს პროგრამირებისა და ლოგიკური მსჯელობის უნარებში წვრთნიდა. სამომავლოდ, მომხმარებლებს Mythos-ის კლასის სხვა მოდელებზეც ექნებათ წვდომა.

ტექნოლოგიის შესაძლებლობების შესამოწმებლად, მკვლევრებმა მოდელს ათასი ღია კოდის მქონე პროგრამული საცავის გაანალიზება და იქ არსებული სისუსტეების პოვნა დაავალეს. მათ ამ სისტემური ჩავარდნების სიმძიმე ერთიდან ხუთამდე შკალით შეაფასეს, სადაც ერთი საბაზისო შეცდომას ნიშნავდა, ხოლო ხუთი – სისტემაზე კონტროლის სრულად ხელში ჩაგდებას. იმავე ტესტში, Mythos Preview-ს წინამორბედებმა, Sonnet 4.6-მა და Opus 4.6-მა, პირველი დონის 150-დან 175-მდე და მეორე დონის 100-მდე შეცდომა იპოვეს, თუმცა მესამე დონის მხოლოდ თითო ხარვეზი დააფიქსირეს. მათგან განსხვავებით, Mythos Preview-მ პირველ და მეორე დონეებზე 595 ჩავარდნა, მესამე და მეოთხე დონეებზე რამდენიმე სუსტი წერტილი აღმოაჩინა, ასევე, 10 განახლებულ სისტემაში უმაღლესი, მეხუთე დონის ხარვეზს მიაგნო, რაც კონტროლის სრულად მოპოვებას ნიშნავს. ეს უნარი ლოგიკური აზროვნების, პროგრამირებისა და ავტონომიური მოქმედების ზოგადი გაუმჯობესების ბუნებრივი შედეგია.

წყარო: Fastcompany; www.marketer.ge