মিশ্র প্রিসিশন কম্পিউটিং - কৃত্রিম বুদ্ধিমত্তা শব্দাবলী

📖

শব্দ

TF32 (টেনসরফ্লোট-৩২)

এনভিডিয়ার ১৯-বিটের মালিকানাধীন হাইব্রিড ফরম্যাট যা FP16-এর ৮-বিট এক্সপোনেন্ট এবং FP32-এর ১০-বিট ম্যান্টিসাকে সংযুক্ত করে, অ্যাম্পিয়ার এবং হপার জিপিইউ-এর টেনসর কোরগুলিতে ম্যাট্রিক্স অপারেশনের জন্য অপ্টিমাইজড।

📖

শব্দ

ডাইনামিক রেঞ্জ

ক্ষুদ্রতম স্বাভাবিক সংখ্যা এবং বৃহত্তম ফ্লোটিং পয়েন্ট সংখ্যার মধ্যে উপস্থাপনযোগ্য মানের পরিসর, নির্ভুলতা নির্বাচনে গুরুত্বপূর্ণ কারণ FP16-এর FP32 (3.4×10³⁸) এর তুলনায় সীমিত ডাইনামিক রেঞ্জ (65504) রয়েছে।

📖

শব্দ

পোস্ট-ট্রেনিং কোয়ান্টাইজেশন (PTQ)

পূর্ণ নির্ভুলতার প্রি-ট্রেন্ড মডেলকে হ্রাসকৃত নির্ভুলতায় (FP16, INT8, INT4) রূপান্তরের প্রক্রিয়া পুনরায় ট্রেনিং ছাড়াই, সর্বোত্তম স্কেল ফ্যাক্টর এবং বায়াস নির্ধারণের জন্য ক্যালিব্রেশন কৌশল ব্যবহার করে।

📖

শব্দ

ফিউজড মাল্টিপ্লাই-অ্যাড (FMA)

হার্ডওয়্যার অপারেশন যা গুণ এবং যোগকে একক নির্দেশে (a×b+c) একক রাউন্ডিং সহ একত্রিত করে, মিশ্র নির্ভুলতায় ম্যাট্রিক্স গণনার ত্বরণের জন্য মৌলিক এবং ক্রমবর্ধমান রাউন্ডিং ত্রুটি হ্রাস করে।

📖

শব্দ

নিউমেরিক্যাল স্টেবিলিটি

রাউন্ডিং ত্রুটি এবং ওভারফ্লো/আন্ডারফ্লোর মুখে গণনার নির্ভুলতা বজায় রাখার জন্য একটি অ্যালগরিদমের বৈশিষ্ট্য, বিশেষত মিশ্র নির্ভুলতায় গুরুত্বপূর্ণ যেখানে হ্রাসকৃত ডাইনামিক রেঞ্জ কিছু গণনাকে অস্থির করতে পারে।

📖

শব্দ

INT8 কোয়ান্টাইজেশন

নিউরাল ওয়েট এবং অ্যাক্টিভেশনগুলিকে ৮-বিট সাইনড ইন্টিজার (-128 থেকে 127) এ স্কেল ফ্যাক্টর এবং জিরো-পয়েন্ট সহ সংকুচিত করার কৌশল, যা ৪x মেমরি হ্রাস এবং সামঞ্জস্যপূর্ণ হার্ডওয়্যারে উল্লেখযোগ্য ত্বরণ প্রদান করে।

📖

শব্দ

প্রিসিশন ম্যাট্রিক্স অপারেশনস

লিনিয়ার অপারেশনের সেট (GEMM, কনভোলিউশন) যেখানে গণনার বিভিন্ন অংশ বিভিন্ন নির্ভুলতা ব্যবহার করে - সাধারণত FP32-এ অ্যাকুমুলেশন এবং FP16/BF16-এ গুণন আধুনিক জিপিইউ-তে থ্রুপুট অপ্টিমাইজ করার জন্য।

এআই গ্লসারি

TF32 (টেনসরফ্লোট-৩২)

ডাইনামিক রেঞ্জ

পোস্ট-ট্রেনিং কোয়ান্টাইজেশন (PTQ)

ফিউজড মাল্টিপ্লাই-অ্যাড (FMA)

নিউমেরিক্যাল স্টেবিলিটি

INT8 কোয়ান্টাইজেশন

প্রিসিশন ম্যাট্রিক্স অপারেশনস

কোন ফলাফল পাওয়া যায়নি