माइक्रोसॉफ्ट के रिसर्च सेंटर ने एक नया AI मॉडल पेश किया है जो स्टील इमेज को पलक झपकते ही GIF में बदल सकता है। Pix2Gif नाम का यह AI टूल, टेक्स्ट-टू-वीडियो AI मॉडल में पाए जाने वाले सर्कुलेटरी मॉडल का उपयोग करता है। Pix2Gif एक “इमेज ट्रांसलेशन” अप्रोच अपनाता है, जिसका अर्थ है कि यूजर्स टेक्स्ट में एडिटिंग डायरेक्शन निर्देश भी दे सकते हैं।
AI टूल कैसे काम करता है:
मॉडल को यूजर्स द्वारा इमेज इनपुट और टेक्स्ट प्रॉम्प्ट के माध्यम से स्पीड के बारे में निर्देश दिया जाता है। यह टेक्स्ट प्रॉम्प्ट के आधार पर बेसिक इमेज की खासियतों को “स्थानिक रूप से बदलने” में मदद करता है। स्टील इमेज से 2-सेकंड का GIF बनाने में AI टूल को लगभग एक मिनट का समय लगता है, लेकिन यह तेज़ GPU के साथ और भी तेज़ी से काम कर सकता है।
मॉडल की ट्रेनिंग:
रिसर्चर्स ने मॉडल को ट्रेन करने के लिए 100,000 एनिमेटेड GIF का उपयोग किया, जिनमें कैप्शन भी शामिल थे। उन्होंने GIF से फ़्रेम निकाले और कैप्शन को टेक्स्ट प्रॉम्प्ट के रूप में इस्तेमाल किया।
यह AI मॉडल अभी एक रिसर्च प्रोजेक्ट है और यह माइक्रोसॉफ्ट के सार्वजनिक रूप से उपलब्ध प्रोडक्ट में नहीं बदल सकता है। यह एक स्टैंडअलोन टूल के रूप में कोपायलट में अपना रास्ता बना सकता है। फिर भी, यह किसी के लिए भी परीक्षण परिवेश में आज़माने के लिए उपलब्ध है। यूजर्स टूल को एक इमेज या एक टेक्स्ट प्रॉम्प्ट दे सकते हैं और एक GIF प्राप्त कर सकते हैं।
माइक्रोसॉफ्ट इस टूल को एनिमेट करना आसान बनाने के लिए डिज़ाइनर या पेंट में शामिल कर सकता है और एआई का इस्तेमाल करके किसी इमेज में समायोजन भी कर सकता है।