ऑडियोक्राफ्ट टेक्स्ट-आधारित उपयोगकर्ता इनपुट से उच्च गुणवत्ता वाले ऑडियो और संगीत उत्पन्न करने के लिए मेटा द्वारा विकसित एक ढांचा है।
इसमें तीन मॉडल शामिल हैं: MusicGen, AudioGen और EnCodec।
MusicGen संगीत उत्पन्न करता है, जबकि AudioGen पाठ इनपुट से ऑडियो उत्पन्न करता है।
उच्च गुणवत ्ता वाले संगीत उत्पादन प्रदान करने के लिए एनकोडेक डिकोडर में सुधार किया गया है।
मॉडल अनुसंधान उद्देश्यों के लिए उपलब्ध हैं और कस्टम डेटासेट के साथ प्रशिक्षित किया जा सकता है।
ऑडियोक्राफ्ट ऑडियो के लिए जनरेटिव मॉडल के डिजाइन को सरल बनाता है और नए मॉडल के विकास की अनुमति देता है।
यह कच्चे ऑडियो सिग्नल से सीखकर उच्च-निष्ठा ऑडियो उत्पन्न करने की चुनौती को संबोधित करता है।
मॉडल में संगीत उत्पादन, ध्वनि प्रभाव और संपीड़न में अनुप्रयोग हैं।
ऑडियोक्राफ्ट के पीछे अनुसंधान का उद्देश्य जनन एआई ऑडियो मॉडल की गुणवत्ता और नियंत्रणीयता में सुधार करना है।
मॉडल अनुसंधान समुदाय में सहयोग और नवाचार को बढ़ावा देने के लिए ओपन-सोर्स हैं।
ऑडियोक्राफ्ट को संगीतकारों और ध्वनि डिजाइनरों के लिए एक उपकरण के रूप में देखा जाता है, जो रचनात्मक उद्योगों में रचनात्मक पुनरावृत्ति प्रक्रिया में सुधार करता है।
फेसबुक की मूल कंपनी मेटा ने उपयोगकर्ता इनपुट के आधार पर संगीत और ऑडियो बनाने के लिए ऑडियोक्राफ्ट नामक एक ओपन-सोर्स जेनरेटिव एआई सिस्टम जारी किया है।
ऑडियोक्राफ्ट के वजन के लाइसेंस के बारे में बहस चल रही है और क्या इसका गैर-वाणिज्यिक लाइसेंस वाणिज्यिक उपयोग को प्रतिबंधित करता है।
चर्चा डेटा स्वामित्व, गोपनीयता और एआई-जनित सामग्री की प्रामाणिकता के मुद्दों के आसपास भी घूमती है।
कुछ उपयोगकर्ता जनरेटिव एआई तकनीक के संभावित दुरुपयोग और मीडिया हेरफेर, विश्वास और संगीत उद्योग पर इसके प्रभाव के बारे में संदेह और चिंता व्यक्त करते हैं।
उत्पन् न संगीत की गुणवत्ता के बारे में आलोचनाएं की जाती हैं, जबकि अन्य एआई-जनित संगीत की संभावनाओं और सीमाओं पर चर्चा करते हैं।
कुल मिलाकर, रचनात्मक उद्देश्यों के लिए एआई का उपयोग करने की क्षमता और चुनौतियों के बारे में राय मिश्रित हैं।
सारांश विभिन्न बिना सेंसर किए मशीन लर्निंग मॉडल की उपलब्धता और विशेषताओं पर चर्चा करता है: लामा 2 7 बी, नौस हर्मेस लामा 2 13 बी, और विज़ार्ड विकुना 13 बी।
यह फिल्मों, खाना पकाने, धार्मिक साहित्य, चिकित्सा जानकारी और सामान ्य जानकारी से संबंधित विभिन्न संकेतों के जवाब में इन मॉडलों के सेंसर और बिना सेंसर किए गए संस्करणों के बीच अंतर को प्रदर्शित करने वाले उदाहरण आउटपुट प्रदान करता है।
सारांश में उल्लेख किया गया है कि एरिक हार्टफोर्ड बिना सेंसर किए गए मॉडल पर एक लोकप्रिय ब्लॉग पोस्ट के लेखक हैं।
बिना सेंसर किए गए मॉडल का उपयोग करने से जुड़े संभावित जोखिमों के बारे में एक अस्वीकरण है।