এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
TF32 (টেনসরফ্লোট-৩২)
এনভিডিয়ার ১৯-বিটের মালিকানাধীন হাইব্রিড ফরম্যাট যা FP16-এর ৮-বিট এক্সপোনেন্ট এবং FP32-এর ১০-বিট ম্যান্টিসাকে সংযুক্ত করে, অ্যাম্পিয়ার এবং হপার জিপিইউ-এর টেনসর কোরগুলিতে ম্যাট্রিক্স অপারেশনের জন্য অপ্টিমাইজড।
ডাইনামিক রেঞ্জ
ক্ষুদ্রতম স্বাভাবিক সংখ্যা এবং বৃহত্তম ফ্লোটিং পয়েন্ট সংখ্যার মধ্যে উপস্থাপনযোগ্য মানের পরিসর, নির্ভুলতা নির্বাচনে গুরুত্বপূর্ণ কারণ FP16-এর FP32 (3.4×10³⁸) এর তুলনায় সীমিত ডাইনামিক রেঞ্জ (65504) রয়েছে।
পোস্ট-ট্রেনিং কোয়ান্টাইজেশন (PTQ)
পূর্ণ নির্ভুলতার প্রি-ট্রেন্ড মডেলকে হ্রাসকৃত নির্ভুলতায় (FP16, INT8, INT4) রূপান্তরের প্রক্রিয়া পুনরায় ট্রেনিং ছাড়াই, সর্বোত্তম স্কেল ফ্যাক্টর এবং বায়াস নির্ধারণের জন্য ক্যালিব্রেশন কৌশল ব্যবহার করে।
ফিউজড মাল্টিপ্লাই-অ্যাড (FMA)
হার্ডওয়্যার অপারেশন যা গুণ এবং যোগকে একক নির্দেশে (a×b+c) একক রাউন্ডিং সহ একত্রিত করে, মিশ্র নির্ভুলতায় ম্যাট্রিক্স গণনার ত্বরণের জন্য মৌলিক এবং ক্রমবর্ধমান রাউন্ডিং ত্রুটি হ্রাস করে।
নিউমেরিক্যাল স্টেবিলিটি
রাউন্ডিং ত্রুটি এবং ওভারফ্লো/আন্ডারফ্লোর মুখে গণনার নির্ভুলতা বজায় রাখার জন্য একটি অ্যালগরিদমের বৈশিষ্ট্য, বিশেষত মিশ্র নির্ভুলতায় গুরুত্বপূর্ণ যেখানে হ্রাসকৃত ডাইনামিক রেঞ্জ কিছু গণনাকে অস্থির করতে পারে।
INT8 কোয়ান্টাইজেশন
নিউরাল ওয়েট এবং অ্যাক্টিভেশনগুলিকে ৮-বিট সাইনড ইন্টিজার (-128 থেকে 127) এ স্কেল ফ্যাক্টর এবং জিরো-পয়েন্ট সহ সংকুচিত করার কৌশল, যা ৪x মেমরি হ্রাস এবং সামঞ্জস্যপূর্ণ হার্ডওয়্যারে উল্লেখযোগ্য ত্বরণ প্রদান করে।
প্রিসিশন ম্যাট্রিক্স অপারেশনস
লিনিয়ার অপারেশনের সেট (GEMM, কনভোলিউশন) যেখানে গণনার বিভিন্ন অংশ বিভিন্ন নির্ভুলতা ব্যবহার করে - সাধারণত FP32-এ অ্যাকুমুলেশন এবং FP16/BF16-এ গুণন আধুনিক জিপিইউ-তে থ্রুপুট অপ্টিমাইজ করার জন্য।