এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
নামযুক্ত সত্তা শনাক্তকরণ (NER)
অসংগঠিত পাঠ্যে পূর্বনির্ধারিত সত্তা যেমন ব্যক্তি, সংস্থা বা স্থান চিহ্নিত ও শ্রেণীবদ্ধ করার জন্য স্বয়ংক্রিয় ভাষা প্রক্রিয়াকরণের একটি উপ-কাজ।
সত্তা নিষ্কাশন
জ্ঞান ভাণ্ডার পূরণের জন্য অসংগঠিত পাঠ্য তথ্য থেকে নির্দিষ্ট সংগঠিত তথ্য (সত্তা) চিহ্নিত ও পৃথক করার প্রক্রিয়া।
সত্তা ট্যাগিং
পাঠ্য থেকে নিষ্কাশিত সত্তাগুলিতে সিম্যান্টিক ট্যাগ সংযুক্ত করার কাজ, যা প্রশ্ন-উত্তর সিস্টেমে তাদের শ্রেণীবিভাগ ও ব্যবহারের সুযোগ সৃষ্টি করে।
সত্তা অভিধান
বৈধ সত্তা ও তাদের প্রকারসমূহ ধারণকারী একটি ডাটাবেস বা সংগঠিত তালিকা, যা QA সিস্টেমে শনাক্তকরণ ও বৈধতা যাচাইয়ের জন্য রেফারেন্স হিসেবে ব্যবহৃত হয়।
NER-এর জন্য সুপারভাইজড লার্নিং
একটি পদ্ধতি যেখানে NER মডেলটি সত্তা চিনতে ও শ্রেণীবদ্ধ করতে শেখার জন্য হাতে অ্যানোটেট করা পাঠ্য কর্পাসে প্রশিক্ষিত হয়।
সিকোয়েন্স টু সিকোয়েন্স মডেল (Seq2Seq)
জটিল NER কাজের জন্য ব্যবহৃত একটি নিউরাল নেটওয়ার্ক আর্কিটেকচার, যা ইনপুট সিকোয়েন্স (পাঠ্য) প্রক্রিয়া করে আউটপুট সিকোয়েন্স (সত্তা ট্যাগ) তৈরি করে।
কনটেক্সট এমবেডিং (ELMo, BERT)
শব্দের ভেক্টর উপস্থাপনা যা পারিপার্শ্বিক প্রসঙ্গের উপর ভিত্তি করে তাদের অর্থ ধারণ করে, দ্ব্যর্থক সত্তা নিষ্কাশনের নির্ভুলতা উল্লেখযোগ্যভাবে বৃদ্ধি করে।
সত্তা স্বাভাবিকীকরণ
নিষ্কাশিত সত্তাগুলির মানসম্মতকরণের প্রক্রিয়া (যেমন: 'মঙ্গলবার', 'মঙ্গল' এবং 'মঙ্গলবার'-কে ক্যানোনিকাল ফর্মে রূপান্তর) ডেটার সামঞ্জস্য নিশ্চিত করার জন্য।
এন্টিটি লিঙ্কিং (Entity Linking)
একটি টেক্সটে উল্লিখিত নামযুক্ত এন্টিটিকে একটি জ্ঞান ভান্ডারে (যেমন: DBpedia বা Wikidata-এর URI) একটি অনন্য এন্ট্রির সাথে সংযুক্ত করার কাজ।
অ্যানোটেটেড কর্পাস
টেক্সটের একটি সংগ্রহ যেখানে এন্টিটিগুলি পূর্বে মানুষ দ্বারা চিহ্নিত এবং লেবেল করা হয়েছে, যা NER মডেলগুলিকে প্রশিক্ষণ এবং মূল্যায়নের জন্য গ্রাউন্ড ট্রুথ হিসেবে কাজ করে।
এক্সট্রাকশনে ফলস পজিটিভ
একটি ত্রুটি যেখানে সিস্টেম ভুলভাবে একটি টেক্সট সেগমেন্টকে প্রাসঙ্গিক এন্টিটি হিসেবে চিহ্নিত করে, যা প্রশ্ন-উত্তর সিস্টেমের নির্ভুলতা নেতিবাচকভাবে প্রভাবিত করে।
এক্সট্রাকশন পাইপলাইন
মডিউলগুলির একটি অনুক্রমিক সিরিজ (টোকেনাইজেশন, NER, নরমালাইজেশন, লিঙ্কিং) যা কাঁচা টেক্সটকে ব্যবহারযোগ্য স্ট্রাকচার্ড এন্টিটিতে রূপান্তরিত করে।
নলেজ-বেজড QA সিস্টেম
এক ধরনের প্রশ্ন-উত্তর সিস্টেম যা একটি স্ট্রাকচার্ড নলেজ বেসে কুয়েরি করে উত্তর খুঁজে পায়, যা এন্টিটি এবং রিলেশন এক্সট্রাকশন দ্বারা পপুলেট করা হয়।
হাইব্রিড NER
নিয়ম-ভিত্তিক পদ্ধতি (প্যাটার্ন ম্যাচিং) এবং মেশিন লার্নিং মডেলগুলিকে একত্রিত করে একটি পদ্ধতি, যাতে প্রথমটির নির্ভুলতা এবং দ্বিতীয়টির নমনীয়তার সুবিধা নেওয়া যায়।
এন্টিটি ডিসঅ্যাম্বিগুয়েশন
অস্পষ্টতা সমাধানের কাজ যখন একই ক্যারেক্টার স্ট্রিং একাধিক পৃথক এন্টিটিকে নির্দেশ করতে পারে (যেমন: 'প্যারিস' শহর বনাম 'প্যারিস' পৌরাণিক চরিত্র)।
NER-এর জন্য ফাইন-টিউনিং
একটি প্রি-ট্রেইন্ড ল্যাঙ্গুয়েজ মডেল (যেমন BERT) কে নামযুক্ত এন্টিটি রিকগনিশন টাস্কের জন্য একটি নির্দিষ্ট কর্পাসে অভিযোজিত করার প্রক্রিয়া।