এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
HDFS
হাডুপের প্রধান বিতরণ ফাইল সিস্টেম যা স্ট্যান্ডার্ড মেশিনের ক্লাস্টারে পেটাবাইট ডেটা সংরক্ষণের জন্য ডিজাইন করা হয়েছে, স্বয়ংক্রিয় প্রতিলিপি এবং ফল্ট টলারেন্স সহ।
MapReduce
ক্লাস্টারে বড় ডেটাসেটের বিতরণ প্রক্রিয়াকরণের জন্য প্রোগ্রামিং প্যারাডাইম এবং বাস্তবায়ন, যা ম্যাপিং এবং রিডাকশন ফেজে কাজগুলো বিভক্ত করে।
YARN
হাডুপের রিসোর্স ম্যানেজার যা ক্লাস্টারে অ্যাপ্লিকেশনগুলিতে CPU এবং মেমরি রিসোর্স বরাদ্দ সমন্বয় করে এবং টাস্ক লাইফসাইকেল পরিচালনা করে।
HBase
বিতরণ করা NoSQL ডাটাবেস, কলাম-ওরিয়েন্টেড এবং নন-রিলেশনাল যা HDFS-এর উপর নির্মিত, শক্তিশীল সামঞ্জস্য সহ বৃহৎ ডেটাতে রিয়েল-টাইম অ্যাক্সেস প্রদান করে।
Hive
হাডুপের উপর ডেটা ওয়্যারহাউস ইনফ্রাস্ট্রাকচার যা SQL-এর অনুরূপ ভাষা (HiveQL) ব্যবহার করে বড় ডেটাসেট জিজ্ঞাসা করতে দেয় এবং এক্সিকিউশনের জন্য MapReduce ব্যবহার করে।
Pig
উচ্চ-স্তরের ডেটা অ্যানালিসিস প্ল্যাটফর্ম যা Pig Latin ভাষা ব্যবহার করে জটিল ডেটা ট্রান্সফরমেশন প্রোগ্রাম প্রকাশ করে যা হাডুপে এক্সিকিউট হয়।
Spark
বিগ ডেটার জন্য অতি-দ্রুত ইউনিফাইড প্রসেসিং ইঞ্জিন, Scala, Java, Python এবং R-এ API সহ, SQL, স্ট্রিমিং, মেশিন লার্নিং এবং গ্রাফ প্রসেসিং-এর জন্য সমর্থন প্রদান করে।
ZooKeeper
কেন্দ্রীভূত বিতরণ সমন্বয় পরিষেবা যা কনফিগারেশন তথ্য, নামকরণ, বিতরণ সিঙ্ক্রোনাইজেশন এবং পরিষেবা গ্রুপ ব্যবস্থাপনা বজায় রাখে।
Flume
একটি বিতরণ করা, নির্ভরযোগ্য এবং উপলব্ধ পরিষেবা যা এজেন্ট-ভিত্তিক স্থাপত্য সহ স্ট্রিমিং ডেটার বিশাল পরিমাণ সংগ্রহ, সমষ্টিবদ্ধ এবং HDFS-এ স্থানান্তর করার জন্য।
Sqoop
হ্যাডুপ এবং রিলেশনাল ডাটাবেসের মতো কাঠামোগত ডাটাবেসের মধ্যে বাল্ক ডেটা দক্ষতার সাথে স্থানান্তর করার জন্য ডিজাইন করা একটি টুল।
Oozie
সময় এবং শর্তাধীন নির্ভরতা সহ জটিল হ্যাডুপ ডেটা প্রক্রিয়াকরণ পাইপলাইন পরিচালনা এবং চালানোর জন্য ওয়ার্কফ্লো এবং সমন্বয়কারী সিস্টেম।
Mahout
বৃহৎ ডেটাসেট প্রক্রিয়াকরণের জন্য হ্যাডুপ MapReduce-এ বাস্তবায়িত বিতরণ করা মেশিন লার্নিং এবং ডেটা মাইনিং অ্যালগরিদমের লাইব্রেরি।
Ambari
সম্পূর্ণ হ্যাডুপ ইকোসিস্টেম প্রোভিশন, পরিচালনা এবং নিরীক্ষণের জন্য একটি ওয়েব ইন্টারফেস প্রদানকারী হ্যাডুপ ক্লাস্টার ব্যবস্থাপনা এবং নিরীক্ষণ প্ল্যাটফর্ম।
HCatalog
হ্যাডুপ ইকোসিস্টেমের জন্য মেটাডেটা এবং টেবিল ব্যবস্থাপনা পরিষেবা, Pig, Hive এবং MapReduce-এর মতো টুলগুলির জন্য ডেটার একটি একীভূত দৃশ্য প্রদান করে।
Avro
বিবর্তনশীল স্কিমা সহ ডেটা সিরিয়ালাইজেশন সিস্টেম, হ্যাডুপ পরিষেবাগুলির মধ্যে বিনিময়ের জন্য কমপ্যাক্ট এবং দ্রুত ডেটা ফরম্যাট প্রদান করে।
Parquet
হ্যাডুপে বিশ্লেষণাত্মক ক্যোয়ারী কর্মক্ষমতার জন্য অপ্টিমাইজড কলামার ফাইল ফরম্যাট, দক্ষ কম্প্রেশন এবং জটিল ধরনের সমর্থন সহ।
ইম্পালা
HDFS এবং HBase-এ সংরক্ষিত ডেটার উপর কম লেটেন্সি ইন্টারেক্টিভ ক্যোয়ারী পারফরম্যান্স প্রদানকারী Hadoop-এর জন্য ব্যাপক সমান্তরাল SQL ক্যোয়ারী ইঞ্জিন।
টেজ
Hadoop YARN-এর জন্য সাধারণীকৃত অ্যাসাইক্লিক ডেটা এক্সিকিউশন ফ্রেমওয়ার্ক, অপ্রয়োজনীয় MapReduce পর্যায়গুলি দূর করে জটিল প্রসেসিংয়ের পারফরম্যান্স অপ্টিমাইজ করে।
স্টর্ম
Hadoop-এর জন্য রিয়েল-টাইম স্ট্রিম প্রসেসিং সিস্টেম, যা মিলিসেকেন্ডের মধ্যে বিশাল পরিমাণ ডেটা প্রসেস করতে সক্ষম।
কাফকা
Hadoop ইকোসিস্টেমে রিয়েল-টাইম ডেটা স্ট্রিম সংগ্রহ ও প্রসেসিংয়ের জন্য উচ্চ পারফরম্যান্স এবং উচ্চ প্রাপ্যতা সহ বিতরণিত মেসেজিং প্ল্যাটফর্ম।