როგორ იცავს Anthropic-ის ახალი AI მოდელი კიბერუსაფრთხოებას

1776007800

commersant/ კომერსანტი

კომპანია Anthropic-მა ახალი, თავისი მომავალი ხელოვნური ინტელექტის მოდელის სატესტო ვერსიის გაშვების შესახებ განაცხადა. პროექტი, რომელსაც Project Glasswing უწოდეს, კრიტიკულ პროგრამულ ინფრასტრუქტურაში არსებული სისუსტეების აღმოჩენასა და აღმოფხვრას ისახავს მიზნად. ამ მასშტაბურ კოალიციაში ისეთი ტექნოლოგიური გიგანტები გაერთიანდნენ, როგორებიცაა Amazon, Apple, Broadcom, Cisco, CrowdStrike, Linux Foundation, Microsoft და Palo Alto Networks. ინიციატივის ფარგლებში, პარტნიორები ახალ მოდელს თავდაცვითი უსაფრთხოების მიზნებისთვის გამოიყენებენ და მიღებულ შედეგებს მთელ ინდუსტრიას გაუზიარებენ. გარდა ამისა, Anthropic წვდომას ანიჭებს კიდევ 40-მდე ორგანიზაციას, რომლებიც კრიტიკული პროგრამული ინფრასტრუქტურის შექმნასა და შენარჩუნებაზე ზრუნავენ.

ბოლო პერიოდში სულ უფრო იზრდება შიში იმის შესახებ, რომ ბოროტმოქმედებმა მძლავრი AI მოდელები, შესაძლოა, ბევრად უფრო დახვეწილი კიბერშეტევებისთვის გამოიყენონ. როგორც კომპანიის წარმომადგენლები განმარტავენ, მსოფლიო კიბერინფრასტრუქტურის დაცვას შესაძლოა წლები დასჭირდეს, მაშინ როცა ხელოვნური ინტელექტის შესაძლებლობები სულ რაღაც რამდენიმე თვეში მნიშვნელოვნად ვითარდება. სწორედ ამიტომ, კიბერდამცველების უპირატესობის შესანარჩუნებლად, დაუყოვნებლივი მოქმედებაა საჭირო. ამ მიზნის მხარდასაჭერად, Anthropic 100 მილიონი დოლარის ღირებულების მოდელის გამოყენების კრედიტებს გამოყოფს, ხოლო 4 მილიონ დოლარს პირდაპირი შემოწირულობის სახით გადასცემს ღია კოდზე მომუშავე უსაფრთხოების ორგანიზაციებს.

უსაფრთხოების მიმართულებით ამ ძლიერი პოტენციალის აღმოჩენა მაშინ მოხდა, როდესაც კომპანია ახალ მოდელს, Claude Mythos Preview-ს პროგრამირებისა და ლოგიკური მსჯელობის უნარებში წვრთნიდა. სამომავლოდ, მომხმარებლებს Mythos-ის კლასის სხვა მოდელებზეც ექნებათ წვდომა.

ტექნოლოგიის შესაძლებლობების შესამოწმებლად, მკვლევრებმა მოდელს ათასი ღია კოდის მქონე პროგრამული საცავის გაანალიზება და იქ არსებული სისუსტეების პოვნა დაავალეს. მათ ამ სისტემური ჩავარდნების სიმძიმე ერთიდან ხუთამდე შკალით შეაფასეს, სადაც ერთი საბაზისო შეცდომას ნიშნავდა, ხოლო ხუთი – სისტემაზე კონტროლის სრულად ხელში ჩაგდებას. იმავე ტესტში, Mythos Preview-ს წინამორბედებმა, Sonnet 4.6-მა და Opus 4.6-მა, პირველი დონის 150-დან 175-მდე და მეორე დონის 100-მდე შეცდომა იპოვეს, თუმცა მესამე დონის მხოლოდ თითო ხარვეზი დააფიქსირეს. მათგან განსხვავებით, Mythos Preview-მ პირველ და მეორე დონეებზე 595 ჩავარდნა, მესამე და მეოთხე დონეებზე რამდენიმე სუსტი წერტილი აღმოაჩინა, ასევე, 10 განახლებულ სისტემაში უმაღლესი, მეხუთე დონის ხარვეზს მიაგნო, რაც კონტროლის სრულად მოპოვებას ნიშნავს. ეს უნარი ლოგიკური აზროვნების, პროგრამირებისა და ავტონომიური მოქმედების ზოგადი გაუმჯობესების ბუნებრივი შედეგია.

წყარო: Fastcompany; www.marketer.ge

ყველა სიახლე

ახლო აღმოსავლეთის ომში მთავარი გამარჯვებული რუსეთი გამოდის

1776013200

აუქციონზე გამოჩნდა Miura SV, რომელსაც სულ 1500 კმ აქვს გავლილი

1776011400

ქართული ხორბალი აღარ იყიდება, ფერმერები იმპორტის დაბეგვრას ითხოვენ

1776009600

როგორ იცავს Anthropic-ის ახალი AI მოდელი კიბერუსაფრთხოებას

1776007800

სააღდგომო სუფრა გაძვირდა — რა დაგვიჯდა ჯეჯულის, კვერცხის, პასკასა და ძირითადი პროდუქტების ყიდვა წელს

1776006000

პოლიტიკა

Fox News-ის სტატია ქართულ-ირანულ კავშირებზე - "ოცნებაში" პირველი კომენტარი კეთდება, სტატიას ოპოზიციაც ეხამურება

საქართველოს საკითხი ევროკავშირში - რა მოლოდინებია თბილისში

11:00 საათზე მთავრობის სხდომა გაიმართება - დღის წესრიგი

საქართველოსა და აზერბაიჯანის მეგობრული ურთიერთობა უმაღლეს ნიშნულზეა - ბიძინა ივანიშვილი

„გრანტების შესახებ“ კანონი კიდევ ერთხელ იცვლება - დიპლომატიური წარმომადგენლობის, საკონსულო დაწესებულებისა და საერთაშორისო ორგანიზაციების მიერ გაცემული რიგი კატეგორიის სახსრები გრანტად არ მიიჩნევა

საზოგადოება

მსოფლიოში ყველაზე უცნაური სააღდგომო ტრადიციები — როგორ ხვდებიან აღდგომას სხვადასხვა ქვეყანაში

1775980920