Microsoft VASA-1 ნეირონული ქსელი დანერგა, რომელსაც შეუძლია ადამიანის რეალისტური ვიდეოების გენერირება ერთი ფოტო და აუდიო ჩანაწერის საფუძველზე.

ნეირონულ ქსელს შეუძლია სახის გამომეტყველებისა და ბუნებრივი მოძრაობების რეპროდუცირება, რომელიც სინქრონიზებულია ხმებთან სტატიკური ფოტოზე დაყრდნობით. მოდელს ასევე შეუძლია შექმნას ონლაინ ვიდეო 512x512 პიქსელით 40 კადრი/წამში სიჩქარით.

VASA-1-ს შეუძლია გაუმკლავდეს მხატვრულ ფოტოებს, სიმღერებს და არაინგლისურ ენას. გარდა ამისა, მომხმარებლებს შეუძლიათ შეცვალონ ავატარის გარეგნობა, პოზიცია და დინამიკა.

როგორც Microsoft აღნიშნავს, კვლევა ხელოვნურ ინტელექტს იყენებს პოზიტიური მიზნებისთვის, თუმცა ეს არ გამორიცხავს იმ საფრთხეს, რომ მოდელი შეიძლება გამოიყენონ ადამიანის საზიანოდ. ასეთი რისკების აღიარებით, მკვლევრებმა გადაწყვიტეს არ გამოეშვათ პროდუქტი ბაზარზე, სანამ არ დარწმუნდნენ, რომ მათი ტექნოლოგია გამოიყენებოდა შესაბამისი რეგულაციების შესაბამისად.

საიტზე ნათქვამია, რომ ნეირონული ქსელი შეიძლება იყოს სასარგებლო ადამიანებისთვის, რომლებსაც აქვთ კომუნიკაციის სირთულეები, ასევე მათთვის, ვისაც თერაპიული მხარდაჭერა სჭირდება.