এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
ডেটা লেক
বড় পরিমাণে কাঁচা ডেটা তাদের মূল ফরম্যাটে সংরক্ষণের জন্য ডিজাইন করা কেন্দ্রীয় সংগ্রহস্থল। এটি পেটাবাইট স্কেলে স্ট্রাকচার্ড, সেমি-স্ট্রাকচার্ড এবং আনস্ট্রাকচার্ড ডেটা সংরক্ষণ করতে সক্ষম।
ডেটা সোয়াম্প
একটি ডেটা লেক যা তার গভর্নেন্স এবং সংগঠন হারিয়েছে, যার ফলে ডেটা অ্যাক্সেস এবং ব্যবহার করা কঠিন হয়ে পড়ে। এটি মেটাডেটা ব্যবস্থাপনা এবং উপযুক্ত ডকুমেন্টেশনের অভাবের ফলে সৃষ্টি হয়।
ডেটা লেকহাউস
ডেটা লেক এবং ডেটা ওয়্যারহাউসের সুবিধাগুলো একত্রিত করে একটি হাইব্রিড আর্কিটেকচার যা ডেটার একীভূত ব্যবস্থাপনা প্রদান করে। এটি একটি উন্মুক্ত এবং পারফরম্যান্সের জন্য অপ্টিমাইজড ফরম্যাটে সংরক্ষিত ডেটার উপর সরাসরি বিশ্লেষণ করতে সক্ষম করে।
ডেটা ইনজেশন
বিভিন্ন উৎস থেকে একটি কেন্দ্রীয় সংরক্ষণ ব্যবস্থা যেমন ডেটা লেকে ডেটা সংগ্রহ এবং স্থানান্তরের প্রক্রিয়া। ব্যবসায়িক প্রয়োজন অনুযায়ী এটি রিয়েল-টাইম, ব্যাচ বা স্ট্রিমিংয়ে সম্পন্ন করা যেতে পারে।
স্কিমা-অন-রিড
একটি পদ্ধতি যেখানে ডেটার স্ট্রাকচার লেখার সময় নয় বরং পড়ার সময় প্রয়োগ করা হয়। এটি পূর্বে স্কিমা সংজ্ঞায়িত না করেই ভিন্নধর্মী ডেটা সংরক্ষণের জন্য সর্বোচ্চ নমনীয়তা প্রদান করে।
স্কিমা-অন-রাইট
একটি ঐতিহ্যবাহী পদ্ধতি যেখানে ডেটার স্কিমা সিস্টেমে লেখার আগেই সংজ্ঞায়িত করতে হয়। এটি ডেটার গুণমান এবং সামঞ্জস্য নিশ্চিত করে কিন্তু সংরক্ষণের নমনীয়তা হ্রাস করে।
ডেটা ক্যাটালগ
একটি ডেটা লেকে উপলব্ধ ডেটা বর্ণনা করে সাজানো এবং সূচিবদ্ধ মেটাডেটা। এটি একটি কেন্দ্রীয় ইন্টারফেসের মাধ্যমে ডেটা আবিষ্কার, বোঝা এবং গভর্নেন্স সহজ করে।
ডেটা গভর্নেন্স
সংস্থার মধ্যে ডেটা ব্যবস্থাপনা সংজ্ঞায়িত করে এমন নীতি, পদ্ধতি এবং মানগুলির সমষ্টি। এটি ডেটা লেকের ডেটার গুণমান, নিরাপত্তা, সম্মতি এবং উপযুক্ত ব্যবহার নিশ্চিত করে।
Data Partitioning
Technique de division des données en segments plus petits basés sur des critères spécifiques comme la date ou la catégorie. Elle optimise les performances des requêtes en limitant la lecture aux partitions pertinentes.
Data Sharding
Partitionnement horizontal des données distribuées sur plusieurs serveurs pour améliorer l'évolutivité et les performances. Chaque shard contient un sous-ensemble unique des données totales.
Data Replication
Processus de copie de données d'un emplacement à un autre pour assurer la haute disponibilité et la tolérance aux pannes. Elle peut être synchrone ou asynchrone selon les exigences de cohérence.
Data Versioning
Mécanisme permettant de suivre et gérer les modifications des données au fil du temps dans un Data Lake. Il facilite l'audit, la reprise après erreur et l'analyse des tendances temporelles.
Data Lineage
Traçabilité complète du cycle de vie des données depuis leur source jusqu'à leur destination finale. Elle documente les transformations, les mouvements et les relations entre les différentes entités de données.
Data Mesh
Architecture décentralisée de gestion des données traitant les données comme des produits distribués. Elle élimine les goulots d'étranglement des équipes centrales en favorisant l'autonomie des domaines fonctionnels.
Delta Lake
Couche de stockage open-source apportant les transactions ACID aux Data Lakes construits sur des systèmes de fichiers distribués. Elle permet les mises à jour, suppressions et requêtes temporelles sur des données parquet.
Apache Iceberg
Format de table open-source pour des Data Lakes géants et analytiques, offrant des performances de requête optimales et une évolution de schéma sans rupture. Il sépare les opérations de planification de celles d'exécution.
Apache Hudi
ডেটা স্ট্রিমিং ফ্রেমওয়ার্ক যা ডেটা লেকগুলিতে ব্যাচ এবং রিয়েল-টাইম প্রক্রিয়াকরণ ক্ষমতা প্রদান করে। এটি ধারাবাহিকতা গ্যারান্টি সহ ইনক্রিমেন্টাল আপডেট এবং মুছে ফেলার অনুমতি দেয়।
Data Virtualization
ডেটা ইন্টিগ্রেশন পদ্ধতি যা তাদের উৎস থেকে শারীরিকভাবে স্থানান্তর না করেই ডেটা অ্যাক্সেস এবং ম্যানিপুলেট করতে দেয়। এটি বিতরণ করা ডেটার একটি একীভূত এবং বিমূর্ত দৃশ্য তৈরি করে।
Data Fabric
একটি একীভূত ডেটা ম্যানেজমেন্ট আর্কিটেকচার যা ডেটা যেখানেই থাকুক না কেন অ্যাক্সেস সুবিধা প্রদান করে। এটি নির্বিঘ্নে ডেটা ইন্টিগ্রেশন, গভর্নেন্স এবং অর্কেস্ট্রেশন একত্রিত করে।
Zone Medallion
ডেটা লেক আর্কিটেকচার যা ডেটাকে তিনটি জোনে সংগঠিত করে: ব্রোঞ্জ (কাঁচা), সিলভার (পরিষ্কার) এবং গোল্ড (এগ্রিগেটেড)। এটি বিশ্লেষণ এবং সিদ্ধান্ত গ্রহণের জন্য ধাপে ধাপে ডেটা কাঠামো করে।