এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
স্ট্রাকচার্ড নলেজ বেস
পূর্বনির্ধারিত স্কিমা অনুযায়ী সংগঠিত ডেটাসেট (যেমন: নলেজ গ্রাফ, রিলেশনাল ডাটাবেস) যা QA সিস্টেমের জন্য তথ্যগত তথ্য সংরক্ষণ এবং পুনরুদ্ধার করতে ব্যবহৃত হয়।
নেমড এনটিটি এক্সট্রাকশন (NER)
এনএলপি প্রক্রিয়া যা নলেজ বেসে তথ্য প্রদানের জন্য আনস্ট্রাকচার্ড টেক্সটে মূল তথ্য (ব্যক্তি, সংস্থা, ওষুধের নাম ইত্যাদি) সনাক্ত করে এবং শ্রেণীবদ্ধ করে।
সিনথেটিক প্রশ্ন জেনারেশন
ডেটা অগমেন্টেশন টেকনিক যেখানে বিদ্যমান ডকুমেন্ট থেকে স্বয়ংক্রিয়ভাবে প্রশ্ন এবং তাদের উত্তর তৈরি করা হয় যাতে কম বাস্তব ডেটা দিয়ে QA মডেল প্রশিক্ষণ দেওয়া যায়।
নলেজ গ্রাফ রিজনিং
একটি QA সিস্টেমের নলেজ গ্রাফের এনটিটিগুলোর (নোড) মধ্যকার সম্পর্ক (এজ) ট্রাভার্স এবং কম্বাইন করে নতুন তথ্য অনুমান করার ক্ষমতা।
কোয়েরি রিরাইটিং
একটি প্রক্রিয়া যা ব্যবহারকারীর প্রশ্ন, প্রায়শই অস্পষ্ট বা ভুলভাবে তৈরি, তথ্য অনুসন্ধান বা নলেজ বেসের প্রশ্নের জন্য অপ্টিমাইজড কোয়েরিতে রূপান্তর করে।
ফ্যাক্ট চেকিং
একটি মেকানিজম যা জেনারেটেড উত্তরটির সামঞ্জস্য এবং সঠিকতা যাচাই করে নির্ভরযোগ্য ডোমেইন সোর্সের সাথে ক্রস-চেক করে, মেডিসিন বা ফাইন্যান্সের মতো উচ্চ-ঝুঁকি অ্যাপ্লিকেশনের জন্য গুরুত্বপূর্ণ।
ডোমেইন-স্পেসিফিক ল্যাঙ্গুয়েজ মডেল
একটি প্রি-ট্রেইন্ড বা ফাইন-টিউন্ড ল্যাঙ্গুয়েজ মডেল যা নির্দিষ্ট ডোমেইনের টেক্সট কর্পাসে (যেমন: মেডিকেল আর্টিকেল, জুরিসপ্রুডেন্স) প্রশিক্ষিত, এটি টেকনিক্যাল জার্গন আরও সঠিকভাবে বুঝতে এবং জেনারেট করতে সক্ষম করে।
হাইব্রিড QA সিস্টেম
একটি আর্কিটেকচার যা একাধিক অ্যাপ্রোচ (যেমন: রুল-বেসড এক্সট্রাকশন, সেমান্টিক সার্চ, নিউরাল মডেল) একত্রিত করে তাদের respective শক্তিগুলোর সুবিধা নেওয়ার জন্য এবং উত্তরের রোবাস্টনেস এবং একুরেসি উন্নত করার জন্য।
উত্তরের ব্যাখ্যাযোগ্যতা
একটি প্রশ্নোত্তর ব্যবস্থার এমন ক্ষমতা যা শুধুমাত্র উত্তরই প্রদান করে না, বরং সেই উত্তরের পেছনের প্রমাণ, উৎস বা যুক্তিও সরবরাহ করে, যা ব্যবহারকারীর আস্থার জন্য অপরিহার্য।
সিম্যান্টিক ইন্ডেক্সিং
একটি প্রযুক্তি যা নথিপত্রগুলিকে কীওয়ার্ডের পরিবর্তে তাদের অর্থ ও প্রসঙ্গের ভিত্তিতে সংগঠিত করে (প্রায়শই এম্বেডিংয়ের মাধ্যমে), যাতে আরও প্রাসঙ্গিক অনুসন্ধান সম্ভব হয়।
তথ্য প্রক্রিয়াকরণ পাইপলাইন
ধারাবাহিক ধাপের একটি ক্রম (যেমন: ইনজেশন, পরিষ্কারকরণ, NER, ইন্ডেক্সিং) যা কাঁচা ডেটাকে কাঠামোবদ্ধ ও অনুসন্ধানযোগ্য জ্ঞানভান্ডারে রূপান্তরিত করে প্রশ্নোত্তর ব্যবস্থার জন্য।
প্রশ্নোত্তর ডেটাতে ফাইন-টিউনিং
একটি পূর্ব-প্রশিক্ষিত ভাষা মডেলকে একটি নির্দিষ্ট ডোমেনের প্রশ্ন-উত্তর জোড়ার ডেটাসেট ব্যবহার করে অভিযোজিত করার প্রক্রিয়া, যাতে প্রশ্নোত্তর কাজে এর কার্যকারিতা উন্নত হয়।
প্রশ্নের অভিপ্রায় সনাক্তকরণ
ব্যবহারকারী কোন ধরনের তথ্য খুঁজছেন তা শ্রেণীবদ্ধ করা (যেমন: সংজ্ঞা, তুলনা, তালিকা, কারণ-প্রভাব) যাতে সর্বাধিক উপযুক্ত উত্তর অনুসন্ধান ও তৈরির কৌশল নির্দেশিত হয়।