সক্রিয় শিখন শক্তিশালীকরণ - কৃত্রিম বুদ্ধিমত্তা শব্দাবলী

📖

শব্দ

Apprentissage Actif par Renforcement

Méthodologie hybride combinant les principes de l'apprentissage actif et de l'apprentissage par renforcement pour optimiser la sélection d'échantillons à annoter.

📖

শব্দ

Politique de Sélection d'Échantillons

Stratégie déterministe ou stochastique définissant quelles données demander à annoter pour maximiser l'amélioration du modèle sous contrainte de budget.

📖

শব্দ

Agent d'Apprentissage par Renforcement

Entité algorithmique qui apprend à prendre des décisions optimales de sélection d'échantillons par interaction avec l'environnement d'annotation.

📖

শব্দ

Fonction de Récompense

Signal quantifiant l'utilité de chaque action de sélection d'échantillon, typiquement basé sur l'amélioration des performances du modèle.

📖

শব্দ

État-Action-Valeur

Fonction Q(s,a) estimant la récompense cumulative attendue en sélectionnant l'action a depuis l'état s et en suivant la politique optimale.

📖

শব্দ

Apprentissage par Renforcement Profond

Extension de l'apprentissage par renforcement utilisant des réseaux de neurones profonds pour approximer les fonctions de valeur ou politiques.

📖

শব্দ

Apprentissage Actif Basé sur l'Incertitude

Stratégie où l'agent sélectionne préférentiellement les échantillons pour lesquels le modèle présente la plus grande incertitude prédictive.

📖

শব্দ

Sélection Stratégique d'Échantillons

Processus décisionnel optimisé visant à identifier les sous-ensembles de données maximisant le gain informationnel par coût d'annotation.

📖

শব্দ

অফ-পলিসি রিইনফোর্সমেন্ট লার্নিং

অনুকূল নীতি শেখার একটি পদ্ধতি যা অন্য একটি আচরণ নীতি অনুসরণ করে, নমনীয় অনুসন্ধানের জন্য উপযোগী।

📖

শব্দ

অনলাইন রিইনফোর্সমেন্ট লার্নিং

একটি প্যারাডাইম যেখানে এজেন্ট অ্যানোটেশন চলাকালীন একই সাথে শেখে এবং নমুনা নির্বাচন করে, তার কৌশল গতিশীলভাবে মানিয়ে নেয়।

📖

শব্দ

লার্নিং-অ্যানোটেশন ভারসাম্য

বুদ্ধিমান নির্বাচনে ব্যয় করা সময় এবং মডেল কর্মক্ষমতায় সম্ভাব্য লাভের মধ্যে সমন্বয় অপ্টিমাইজ করা।

📖

শব্দ

ডেটা অ্যাকুইজিশন কৌশল

পূর্বনির্ধারিত মানদণ্ড অনুযায়ী অ্যানোটেশন করার জন্য সবচেয়ে প্রাসঙ্গিক ডেটা চিহ্নিত এবং সংগ্রহ করার জন্য একটি পদ্ধতিগত কর্মপরিকল্পনা।

📖

শব্দ

মাল্টি-এজেন্ট রিইনফোর্সমেন্ট লার্নিং

একটি এক্সটেনশন যেখানে একাধিক এজেন্ট নমুনা নির্বাচন কৌশল যৌথভাবে অপ্টিমাইজ করার জন্য সহযোগিতা বা প্রতিযোগিতা করে।

📖

শব্দ

একটিভ কিউ-লার্নিং অ্যালগরিদম

একটিভ লার্নিং-এর জন্য অভিযোজিত কিউ-লার্নিং-এর একটি বৈকল্পিক, যেখানে ক্রিয়াগুলি অ্যানোটেশন করার জন্য নমুনা নির্বাচনের সাথে সঙ্গতিপূর্ণ।

📖

শব্দ

গাইডেড এক্সপ্লোরেশন পলিসি

মডেলের জন্য সম্ভাব্য সবচেয়ে তথ্যপূর্ণ ডেটা স্পেসের অঞ্চলগুলির দিকে পরিচালিত অনুসন্ধান কৌশল।

📖

শব্দ

বেইজিয়ান রিইনফোর্সমেন্ট লার্নিং

নমুনা নির্বাচনে আরও শক্তিশীল সিদ্ধান্ত গ্রহণের জন্য মান ফাংশন অনুমানে অনিশ্চয়তা সংহত করার একটি পদ্ধতি।

এআই গ্লসারি

Apprentissage Actif par Renforcement

Politique de Sélection d'Échantillons

Agent d'Apprentissage par Renforcement

Fonction de Récompense

État-Action-Valeur

Apprentissage par Renforcement Profond

Apprentissage Actif Basé sur l'Incertitude

Sélection Stratégique d'Échantillons

অফ-পলিসি রিইনফোর্সমেন্ট লার্নিং

অনলাইন রিইনফোর্সমেন্ট লার্নিং

লার্নিং-অ্যানোটেশন ভারসাম্য

ডেটা অ্যাকুইজিশন কৌশল

মাল্টি-এজেন্ট রিইনফোর্সমেন্ট লার্নিং

একটিভ কিউ-লার্নিং অ্যালগরিদম

গাইডেড এক্সপ্লোরেশন পলিসি

বেইজিয়ান রিইনফোর্সমেন্ট লার্নিং

কোন ফলাফল পাওয়া যায়নি