• २०८१ बैशाख १७ सोमबार

टेक्स्ट वा तस्बीरबाट भिडियो बनाउन गुगलले ल्यायो लुमिएर

kharibot

काठमाडौँ । अब तपाईले आर्टिफिसियल इन्टेलिजेन्स (एआई) को सहयोगमा टेक्स्ट लेखेर सीधै भिडियो बनाउन सक्नुहुनेछ । यसका लागि गुगलले आफ्नो नयाँ एआई मल्टिमोडल लुमिएर लन्च गरेको छ । गुगलको नयाँ एआई मोडेल टेक्स्ट-टू-भिडियो र इमेज-टू भिडियो मोडेल हो ।

यसले वास्तविक र विभिन्न प्रकारका गतिहरू सिर्जना गरेर भिडियोहरू बनाउन सक्छ । अर्थात्, यसबाट तपाईले टेक्स्टबाट सीधै भिडियो मात्र बनाउन सक्नुहुन्न, तर तस्बीरबाट मोशन भिडियो पनि बनाउन सक्नुहुन्छ ।

लुमिएरमा, तपाईंले भर्खर टेक्स्ट वा फोटो इनपुट गर्नुपर्नेछ र एआई न्यूरल नेटवर्कले भिडियो सिर्जना गर्नेछ र तपाईंलाई दिनेछ। उपकरणले तस्बीरहरू एनिमेसन गर्न र इनपुट तस्बीरहरू वा चित्रहरूको ढाँचामा भिडियोहरू सिर्जना गर्न अनुमति दिन्छ । यो मोडेलले तस्बीर र भिडियोहरूमा विशेष एनिमेसन र चित्रहरू समेत सिर्जना गर्छ ।

गुगलको नयाँ लुमिएरले स्पेस-टाइम यू-नेट आर्किटेक्चर विधिबाट, परम्परागत भिडियो मोडेलको विपरीत, प्रति एकल फ्रेममा सम्पूर्ण भिडियो उत्पादन गर्दछ । यसको विपरित, अवस्थित एआई भिडियो मोडेलहरूले मुख्य फ्रेमहरूलाई एकै समयमा धेरै टाढा संश्लेषण गर्दछ । यस नवीन प्रविधिले टेम्पोरल सुपर-रिजोल्युसन पछि टाढाको किफ्रेमहरू संश्लेषण गर्ने आवश्यकतालाई हटाउँछ । यसको साथ, भिडियोमा स्थिरता सजिलै प्राप्त हुन्छ ।

गुगलका अनुसन्धानकर्ताहरूका अनुसार टेक्स्ट-टू-भिडियो जेनेरेशन फ्रेमवर्क पूर्व-प्रशिक्षित टेक्स्ट-टू-इमेज डिफ्यूजन प्रयोग गरेर प्रस्तुत गरिएको छ । टोलीले स्पेस-टाइम यू-नेट आर्किटेक्चर प्रयोग गरेर पूर्ण फ्रेम भिडियो क्लिपहरू उत्पन्न गरेका छन् । यसले स्थानीक र अस्थायी मोड्युलहरू समावेश गर्दछ । यसले भिडियोमा तस्बीर, भिडियो इनपेन्टिङ र स्टाइलाइज्ड जेनरेशनमा राम्रो नतिजा दिएको छ ।
 

सम्बन्धित खबर

पढ्नै पर्ने

लोकप्रिय

भर्खरै