🏠 होम
बेंचमार्क
📊 सभी बेंचमार्क 🦖 डायनासोर v1 🦖 डायनासोर v2 ✅ टू-डू लिस्ट ऐप्स 🎨 रचनात्मक फ्री पेज 🎯 FSACB - अल्टीमेट शोकेस 🌍 अनुवाद बेंचमार्क
मॉडल
🏆 टॉप 10 मॉडल 🆓 मुफ्त मॉडल 📋 सभी मॉडल ⚙️ किलो कोड
संसाधन
💬 प्रॉम्प्ट लाइब्रेरी 📖 एआई शब्दावली 🔗 उपयोगी लिंक

एआई शब्दावली

आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश

179
श्रेणियाँ
1,183
उप-श्रेणियाँ
14,904
शब्द
📖
शब्द

पैरामीटर-कुशल फाइन-ट्यूनिंग (PEFT)

फाइन-ट्यूनिंग की वे विधियाँ जो मॉडल के केवल एक छोटे उपसमुच्चय पैरामीटर को संशोधित करती हैं जबकि अधिकांश वज़नों को स्थिर रखती हैं, जिससे कम्प्यूटेशनल और भंडारण लागत कम होती है।

📖
शब्द

QLoRA (क्वांटाइज्ड LoRA)

LoRA का एक प्रकार जो 4-बिट क्वांटिज़ेशन और लो-रैंक एडाप्टेशन को जोड़ता है, जिससे सीमित हार्डवेयर संसाधनों पर बहुत बड़े मॉडल का फाइन-ट्यूनिंग संभव होता है।

📖
शब्द

प्रीफिक्स ट्यूनिंग

एक विधि जो केवल इनपुट अनुक्रमों में जोड़े गए निरंतर प्रीफिक्स को अनुकूलित करती है, मॉडल के वज़नों को बदले बिना, विशिष्ट कार्यों के लिए इसके व्यवहार को अनुकूलित करने के लिए।

📖
शब्द

प्रॉम्प्ट ट्यूनिंग

प्रॉम्प्ट एम्बेडिंग का अनुकूलन जो विशेष रूप से एक प्री-ट्रेन्ड मॉडल के व्यवहार को निर्देशित करने के लिए सीखा जाता है, बिना इसके आंतरिक पैरामीटर बदले।

📖
शब्द

इंस्ट्रक्शन फाइन-ट्यूनिंग

इंस्ट्रक्शन-उत्तर जोड़े पर अतिरिक्त प्रशिक्षण की प्रक्रिया जो मॉडल को निर्देशों का सटीक पालन करना और उचित उत्तर उत्पन्न करना सिखाती है।

📖
शब्द

DPO (डायरेक्ट प्रेफरेंस ऑप्टिमाइज़ेशन)

RLHF का एक विकल्प जो सीधे मानव प्राथमिकता डेटा से मॉडल को अनुकूलित करता है, बिना किसी मध्यवर्ती रिवार्ड मॉडल की आवश्यकता के, एलाइनमेंट प्रक्रिया को सरल बनाता है।

🔍

कोई परिणाम नहीं मिला