مدیریت داده فرآیند جمع‌آوری، ذخیره‌سازی، سازماندهی، نگهداری و بازیابی داده‌ها به شیوه‌ای سیستماتیک و کنترل شده برای اطمینان از صحت، کامل بودن، امنیت و در دسترس بودن آنهاست.

در واقع، هنر مدیریت داده‌ها از زمان ایجاد تا دور ریختن، حصول اطمینان از دقیق، امن بودن و دسترسی آسان برای تجزیه و تحلیل و تصمیم‌گیری است. به طور خلاصه و کوتاه می‌توان بیان کرد مدیریت داده، جمع‌آوری، ذخیره‌سازی، سازماندهی، نگهداری و بازیابی داده‌ها می‌باشد.

روندهای مدیریت داده‌ها

مدیریت داده‌های مبتنی بر ابر: با افزایش پذیرش رایانش ابری، راه‌حل‌های مدیریت داده مبتنی بر ابر رایج‌تر می‌شوند. انتظار می‌رود مقالات و کتاب‌های بیشتری با تمرکز بر انبار داده‌های مبتنی بر ابر، دریاچه‌های داده و تجزیه و تحلیل داده‌های بزرگ را شاهد باشیم.

هوش مصنوعی (AI) و یادگیری ماشین (ML) در مدیریت داده‌ها: هوش مصنوعی و ML نقش مهمی در مدیریت داده‌ها ایفا و امکان پردازش بی‌درنگ داده‌ها، تجزیه و تحلیل پیش‌بینی‌کننده و تصمیم‌گیری خودکار را فراهم می‌کنند.

حاکمیت داده: همانطور که داده‌ها به طور فزاینده‌ای برای کسب و کارها حیاتی می‌شوند، حاکمیت داده به اولویت اصلی تبدیل می‌شود. و باید منتظر مقالات و کتاب‌های بیشتری در مورد چارچوب‌ها، سیاست‌ها و بهترین شیوه‌های حاکمیت داده بود.

محاسبه لبه: با ظهور دستگاه‌های اینترنت اشیاء و تولید داده‌های بلادرنگ، محاسبات لبه برای مدیریت داده‌ها اهمیت بیشتری پیدا می‌کند. مقالات و کتاب‌ها بر معماری‌های محاسبات لبه، امنیت و پردازش داده‌ها تمرکز خواهند داشت.

مدیریت داده مبتنی بر بلاک‌چین: فن‌آوری بلاک چین هم‌چنان در مدیریت داده‌ها جذاب خواهد بود و ذخیره و به اشتراک‌گذاری داده‌ها را ایمن، غیرمتمرکز و شفاف می‌کند.

حوزه تحقیقاتی و فن‌آوری مدیریت داده‌ها شامل مفاهیم، تکنیک‌ها، الگوریتم‌ها و فن‌آوری‌های مختلفی از جمله مدل‌سازی داده‌ها، ادغام و جذب داده‌ها، مدیریت داده‌های تراکنشی، زبان‌های پرس و جو، بهینه‌سازی پرس و جو، ذخیره‌سازی فیزیکی داده‌ها، ساختارهای داده، تکنیک‌های تحلیلی (از جمله پردازش تحلیلی آنلاین [1])، و همچنین ایجاد خدمات و تنظیم می‌باشند. فن‌آوری‌های مدیریت داده اجزای اصلی هر سیستم اطلاعاتی هستند، خواه متمرکز خواه توزیع‌شده باشند، که در یک معماری سخت‌افزاری یا سیستم ابری مستقر شده‌اند. فن‌آوری‌های مدیریت داده برای دهه‌ها در محصولات تجاری و بالغ مورد استفاده قرار گرفته‌اند. آن‌ها در اصل برای مدیریت داده‌های ساختار یافته (عمدتا در مدل داده‌های رابطه‌ای بیان می‌شوند) توسعه داده شدند. از مسائل پژوهشی منتخب در مدیریت داده‌ها و سیستم‌های پژوهشی، پردازش گراف، پردازش تحلیلی آنلاین و یادگیری ماشین می‌باشد [1].

هدف، استخراج سه ویژگی خاص از داده‌ها یعنی وجود، هماهنگی و محاسبه برای درک روندها در معماری طرح داده است. توانمندسازهای فن‌آوری در هر طرح معماری تمرکز بر این سه ویژگی داده‌ای دارند و چهار ویژگی بنیادی داده‌ها در صنعت که در راستای مدیریت داده‌ها پراهمیت خواهند بود: حجم، تنوع، ترافیک و اهمیت داده‌ها می‌باشد [2].

در یک پژوهش در سال 2023 [3]، مدیریت داده به فرآیند ذخیره، بازیابی و پردازش مقادیر زیادی داده از منابع مختلف به صورت غیرمتمرکز و ایمن اشاره دارد؛ نیز، رویکردی نوآورانه برای مدیریت داده ارائه می‌شود که به چالش‌های ناشی از داده‌های بزرگ و برنامه‌های کاربردی اینترنت اشیا می‌پردازد که یک نمای کلی و جامع از معماری بافت داده و کاربردهای بالقوه آن در صنایع مختلف ارائه می‌دهد. نویسندگان استدلال می‌کنند  سیستم‌های مدیریت داده متمرکز سنتی در توانایی برای مدیریت افزایش حجم، سرعت و تنوع داده‌های تولید شده توسط دستگاه‌های اینترنت اشیاء  و سایر منابع محدود هستند.

معماری بافت داده [2] با استفاده از فن‌آوری DLT، برای ایجاد یک شبکه غیرمتمرکز از گره‌ها که داده‌ها را به شیوه‌ای توزیع‌شده ذخیره و مدیریت می‌کند، این چالش‌ها را برطرف خواهد ساخت. هر گره، مسئول مدیریت بخشی از داده‌ها و اطمینان از یکپارچگی و در دسترس بودن آن است. نویسندگان از یک سیستم ذخیره‌سازی سلسله مراتبی برای سازماندهی داده‌ها در لایه‌ها استفاده می‌کنند که امکان پرس و جو و بازیابی کارآمد داده‌ها را فراهم می‌کند.

تمرکززدایی: داده‌ها به صورت غیرمتمرکز ذخیره و مدیریت می‌شوند، که باعث می‌شود در برابر نقاط شکست منفرد مقاوم‌تر شوند و اطمینان حاصل شود که هیچ نهاد واحدی بر کل سیستم کنترل ندارد.

فن‌آوری دفتر کل توزیع شده  (DLT): استفاده از DLT امکان ثبت امن، شفاف و غیرقابل تغییر تراکنش‌ها و به روز رسانی داده‌ها را فراهم می‌کند.

سیستم ذخیره‌سازی سلسله مراتبی: در پژوهشی که انجام گرفته [3]، یک سیستم ذخیره‌سازی سلسله مراتبی پیشنهاد شده است که داده‌ها را در لایه‌هایی سازماندهی و امکان جستجو و بازیابی کارآمد داده‌ها را فراهم می‌کند.

یکپارچگی داده‌ها: بافت داده یکپارچگی داده‌ها را با استفاده از تکنیک‌های رمزنگاری برای تأیید صحت و یکپارچگی داده‌های ذخیره شده در هر گره تضمین می‌کند.

مقیاس‌پذیری: معماری به گونه‌ای طراحی شده است که مقیاس‌پذیر باشد و به آن اجازه می‌دهد تا حجم فزاینده‌ای از داده‌ها و ترافیک کاربر را مدیریت کند.

منابع

[1] Darmont.J., Novikov.B and Bellatreche.L; Advances on Data Management and Information Systems (2022), Information Systems Frontier, Springer Nature.

[2] Paptis.T.P, Passarella.A and Conti.M, Data Management in Industry: State of the Art and Open Challenges, IEEE Access, Vol7.

[3] Data Fabric: A New Paradigm for Data Management” by Muthanna Almashhedi, et al., IEEE Transactions on Industrial Informatics, Vol. 19, No. 1, 2023, pp. 363-374.