ცოტა ხნის წინ შევიტყვეთ, რომ საქართველოში პირველად ხელოვნური ინტელექტის მიერ გახმოვანებული წიგნების მოსმენა გახდა შესაძლებელი. „საბამ” “wavetech” – თან თანამშრომლობით ციფრულ ბიბლიოთეკაში უკვე 20-მდე ასეთი წიგნი დაამატა.
“wavetech-ის შექმნის ერთ-ერთი მთავარი მიზანი სკალირებადი სისტემის შექმნა იყო, რადგან ადამიანური რესურსების სკალირება უზარმაზარ ფინანსურ და დროის რესურსებთანაა დაკავშირებული. ასეთი სერვისის არსებობის შემთხვევაში კი, მოთხოვნის / დატვირთვის ზრდის შესაბამისად სკალირება მარტივი ტექნიკური პრობლემაა. შესაბამისად, რადგან “საბას“, როგორც ბაზარზე ყველაზე დიდ ელ. Წიგნების პლატფორმას, ათასობით წიგნი აქვს – ადამიანური რესურსებით ამ ყოველივეს გახმოვანება რამდენიმე წელსა და უზარმაზარ ფინანსურ რესურსს საჭიროებდა. თუმცა, ჩვენი რეალისტური ხმოვანი აგენტებით “საბას” 20-მდე წიგნის გახმოვანება სულ რაღაც 20 წუთში შევძელით – როცა ადამიანური რესურსებით ამ ყოველივეს 4 თვეზე მეტი დაჭირდებოდა“ აღნიშნა სოფი ზამბახიძემ (wavetech-ის Chief Product Officer).
რა ხდება საქართველოს ფარგლებს გარეთ?
წლის დასაწყისში The Guardian-მა გამოაქვეყნა სტატია, რომლის სათაურიც ასეთი იყო: „ნარატორის სიკვდილი?“. სტატიაში ამ კითხვაზე პასუხის გაცემა არ უცდიათ, თუმცა იმის შესახებ დაწერეს, რისი გავლენაც ნელ-ნელა იზრდება მსოფლიოში.
საქმე ისაა, რომ ბოლო წლებში აუდიოწიგნების პოპულარობა საგრძნობლად გაიზარდა. შესაბამისად, გაიზარდა გაყიდვები და ამ გაყიდვებიდან მიღებული შემოსავალიც. Apple-მა ჯერ კიდევ ნოემბერში დაიწყო პროექტის შესახებ საუბარი, მაგრამ Meta-სა და ილონ მასკთან დაკავშირებული ქაოსის გამო დროებით გადადო. თუმცა, საბოლოოდ, მათი პროექტი, რომელიც ხელოვნური ინტელექტის ინტენსიურ გამოყენებას მოიაზრებდა წიგნების გახმოვანების პროცესში, შედგა: Apple-ს უკვე აქვს კატალოგი, რომელშიც იმ წიგნების მოძებნაა შესაძლებელი, რომლებიც ხელოვნური ინტელექტის მიერაა გახმოვანებული. ხმით, რომელიც ადამიანი-ნარატორის ხმას დაეფუძნა.
ამ ინოვაციის ავკარგიანობაზე განსხვავებული პოზიციები აქვთ. ცალსახაა, რომ ამ ტექნოლოგიის განვითარებას მნიშვნელოვანი გავლენა ექნება იმაზე, თუ როგორ დაინახავენ მსხვილი ტექნოლოგიური კომპანიები აუდიოწიგნების მომავალს. გამომცემლები, ავტორები და ლიტერატურული აგენტები კი თანხმდებიან, რომ თუკი ეს წამოწყება წარმატებული იქნება, დიდი იქნება მისი გავლენა ბაზარზე. The Guardian-თან საუბრისას ისინი აღნიშნავენ, რომ რაღაც ძალიან განსხვავებული იქმნება; რაღაც, რაში მონაწილეობა ნამდვილად ღირს.
მაგრამ მათ შორის არიან ისინიც, ვინც უფრო სკეპტიკურად უყურებს საკითხს.
ერთ-ერთმა კანადელმა ლიტერატურის აგენტმა იმავე გამოცემასთან საუბრისას თქვა, რომ კომპანიებისთვის მხოლოდ ფულის გამომუშავების საშუალებაა აუდიოწიგნები, მაშინ, როდესაც მომხმარებლისთვის ამას სრულიად განსხვავებული დატვირთვა აქვს, რადგან, სინამდვილეში, ამბის თხრობაში ბევრად მეტი ღირებულებაა, ვიდრე ისინი ფიქრობენ.
ხელოვნური ინტელექტის გამოყენებას რამდენიმე ძირითადი უპირატესობა აქვს: წიგნების ადამიანების მიერ გახმოვანებას დიდი დრო და ფინანსები სჭირდება. ხელოვნური ინტელექტის გამოყენება კი მნიშვნელოვნად შეამცირებს ხარჯებს და დროსაც დაზოგავს.
მიუხედავად ამისა, ჯერჯერობით ისევ რთულია კომპიუტერის მიერ გენერირებული ხმების ადამიანების ხმებთან მიმსგავსება. ადამიანების ინტონაცია და რეაქციები (როგორ წაიკითხავენ კონკრეტულ ეპიზოდებს და ა.შ.) ძნელად პროგნოზირებადია და არც მათი გამეორებაა იოლი.
Apple განმარტავს, რომ ამ პროექტის სამიზნე პატარა გამომცემლობები და ის ავტორები იქნებიან, რომლებიც დამოუკიდებლად გამოსცემენ წიგნებს. ისინი, ვისაც სურთ, ათობით წიგნი აქციონ აუდიოწიგნად, მაგრამ პროფესიონალი გამხმოვანებლების დაქირავება მათ ფინანსურ შესაძლებლობებს აღემატება.
კრისტენ ეთრიჯი ერთ-ერთია იმ ავტორთაგან, ვისი წიგნიც ხელოვნურმა ინტელექტმა გაახმოვანა. ეთრიჯი Apple Books-ის საპილოტე პროგრამაში იყო ჩართული (თავდაპირველად გასაჯაროებული არ იყო, ვინ იდგა ამ წამოწყების უკან და მხოლოდ მოგვიანებით გამჟღავნდა). იგი ინტერვიუში აღნიშნავს, რომ ერთი დასრულებული წიგნი დაახლოებით 2 000-2 500 დოლარი ჯდება, რაც სამართლიანი ანაზღაურებაა შესრულებული სამუშაოსთვის, მაგრამ, მეორე მხრივ, დიდი ბარიერია დამოუკიდებელი გამომცემლებისთვის, რომლებსაც ბევრი ბეჭდური ტექსტის გადაქცევა სურთ აუდიოწიგნად. მნიშვნელოვანია ისიც, რომ იგი არჩევანს არ აკეთებს ადამიან-მთხრობელსა და ციფრულ ნარატორს შორის. სინამდვილეში, მას არჩევა უწევს ხელოვნური ინტელექტის მიერ გახმოვანებულ წიგნებსა და საერთოდ გაუხმოვანებელ წიგნებს შორის (რადგან სხვა შემთხვევაში ვერ მოამზადებს აუდიოვერსიებს).
ეთრიჯი იმასაც ამბობს, რომ ადამიანები უკეთ კითხულობენ, იციან, რა ინტონაციით უნდა ისაუბრონ, როდისაა საჭირო უფრო გრძელი პაუზა, როგორ უნდა წარმოითქვას კონკრეტული სიტყვები სხვადასხვა ჟანრის წიგნში, მაგრამ, სამაგიეროდ, ხელოვნური ინტელექტის მიერ წაკითხული წიგნები კარგი არჩევანია არა მარტო ავტორებისთვის, არამედ იმ მკითხველებისთვისაც, ვინც ფასზე ღელავს. მართალია, ეს ვერ იქნება სრულყოფილი გამოცდილება, მაგრამ ხელმისაწვდომობაც გასათვალისწინებელი ფაქტორია მკითხველებისთვის.
მიუხედავად ავტორების კეთილგანწყობისა, მეორე მხარეს დგანან ის ადამიანები, რომლებიც ღელავენ, რომ სამსახურს დაკარგავენ, თუკი მთლიანად ციფრული ნარატორებით ჩანაცვლდებიან (როგორც სხვადასხვა ვებგვერდებზე ვკითხულობთ, უცხოურ ბაზარზე გამხმოვანებლების საათობრივი ანაზღაურება, მათი გამოცდილების შესაბამისად, 100-დან 350 დოლარამდე მერყეობს და ეს უამრავი ადამიანისთვის შემოსავლის ძირითადი წყაროა). მათი ნაწილი იმის გამოც ღელავს, რომ მათ ჩანაწერებს გამოიყენებენ ხელოვნური ინტელექტისთვის სწავლების პროცესში. ვირტუალური ასისტენტებისთვის Apple უკვე წლებია იყენებს სინთეტიკურ ხმას, მაგრამ წიგნების გახმოვანება ბევრად უფრო რთული და კომპლექსური ამოცანაა ტექნოლოგიებისთვის. ამიტომაც მათ დასახვეწად და გასაუმჯობესებლად მეტი მუშაობა იქნება საჭირო. ავტორები კი ეჭვობენ, რომ ამ პროცესში უკვე არსებული ჩანაწერები (ადამიანების მიერ გახმოვანებული აუდიოწიგნები) იქნება გამოყენებული მათი ნებართვის გარეშე.
ამჟამად Apple-ს ორი ნარატორი ჰყავს – მედისონი და ჯექსონი და როგორც უკვე დაანონსებულია, ახლო მომავალში კიდევ ორი „ხმის“ დამატებასაც გეგმავენ.
© არილი