مدیریت داده فرآیند جمعآوری، ذخیرهسازی، سازماندهی، نگهداری و بازیابی دادهها به شیوهای سیستماتیک و کنترل شده برای اطمینان از صحت، کامل بودن، امنیت و در دسترس بودن آنهاست.
در واقع، هنر مدیریت دادهها از زمان ایجاد تا دور ریختن، حصول اطمینان از دقیق، امن بودن و دسترسی آسان برای تجزیه و تحلیل و تصمیمگیری است. به طور خلاصه و کوتاه میتوان بیان کرد مدیریت داده، جمعآوری، ذخیرهسازی، سازماندهی، نگهداری و بازیابی دادهها میباشد.
روندهای مدیریت دادهها
مدیریت دادههای مبتنی بر ابر: با افزایش پذیرش رایانش ابری، راهحلهای مدیریت داده مبتنی بر ابر رایجتر میشوند. انتظار میرود مقالات و کتابهای بیشتری با تمرکز بر انبار دادههای مبتنی بر ابر، دریاچههای داده و تجزیه و تحلیل دادههای بزرگ را شاهد باشیم.
هوش مصنوعی (AI) و یادگیری ماشین (ML) در مدیریت دادهها: هوش مصنوعی و ML نقش مهمی در مدیریت دادهها ایفا و امکان پردازش بیدرنگ دادهها، تجزیه و تحلیل پیشبینیکننده و تصمیمگیری خودکار را فراهم میکنند.
حاکمیت داده: همانطور که دادهها به طور فزایندهای برای کسب و کارها حیاتی میشوند، حاکمیت داده به اولویت اصلی تبدیل میشود. و باید منتظر مقالات و کتابهای بیشتری در مورد چارچوبها، سیاستها و بهترین شیوههای حاکمیت داده بود.
محاسبه لبه: با ظهور دستگاههای اینترنت اشیاء و تولید دادههای بلادرنگ، محاسبات لبه برای مدیریت دادهها اهمیت بیشتری پیدا میکند. مقالات و کتابها بر معماریهای محاسبات لبه، امنیت و پردازش دادهها تمرکز خواهند داشت.
مدیریت داده مبتنی بر بلاکچین: فنآوری بلاک چین همچنان در مدیریت دادهها جذاب خواهد بود و ذخیره و به اشتراکگذاری دادهها را ایمن، غیرمتمرکز و شفاف میکند.
حوزه تحقیقاتی و فنآوری مدیریت دادهها شامل مفاهیم، تکنیکها، الگوریتمها و فنآوریهای مختلفی از جمله مدلسازی دادهها، ادغام و جذب دادهها، مدیریت دادههای تراکنشی، زبانهای پرس و جو، بهینهسازی پرس و جو، ذخیرهسازی فیزیکی دادهها، ساختارهای داده، تکنیکهای تحلیلی (از جمله پردازش تحلیلی آنلاین [1])، و همچنین ایجاد خدمات و تنظیم میباشند. فنآوریهای مدیریت داده اجزای اصلی هر سیستم اطلاعاتی هستند، خواه متمرکز خواه توزیعشده باشند، که در یک معماری سختافزاری یا سیستم ابری مستقر شدهاند. فنآوریهای مدیریت داده برای دههها در محصولات تجاری و بالغ مورد استفاده قرار گرفتهاند. آنها در اصل برای مدیریت دادههای ساختار یافته (عمدتا در مدل دادههای رابطهای بیان میشوند) توسعه داده شدند. از مسائل پژوهشی منتخب در مدیریت دادهها و سیستمهای پژوهشی، پردازش گراف، پردازش تحلیلی آنلاین و یادگیری ماشین میباشد [1].
هدف، استخراج سه ویژگی خاص از دادهها یعنی وجود، هماهنگی و محاسبه برای درک روندها در معماری طرح داده است. توانمندسازهای فنآوری در هر طرح معماری تمرکز بر این سه ویژگی دادهای دارند و چهار ویژگی بنیادی دادهها در صنعت که در راستای مدیریت دادهها پراهمیت خواهند بود: حجم، تنوع، ترافیک و اهمیت دادهها میباشد [2].
در یک پژوهش در سال 2023 [3]، مدیریت داده به فرآیند ذخیره، بازیابی و پردازش مقادیر زیادی داده از منابع مختلف به صورت غیرمتمرکز و ایمن اشاره دارد؛ نیز، رویکردی نوآورانه برای مدیریت داده ارائه میشود که به چالشهای ناشی از دادههای بزرگ و برنامههای کاربردی اینترنت اشیا میپردازد که یک نمای کلی و جامع از معماری بافت داده و کاربردهای بالقوه آن در صنایع مختلف ارائه میدهد. نویسندگان استدلال میکنند سیستمهای مدیریت داده متمرکز سنتی در توانایی برای مدیریت افزایش حجم، سرعت و تنوع دادههای تولید شده توسط دستگاههای اینترنت اشیاء و سایر منابع محدود هستند.
معماری بافت داده [2] با استفاده از فنآوری DLT، برای ایجاد یک شبکه غیرمتمرکز از گرهها که دادهها را به شیوهای توزیعشده ذخیره و مدیریت میکند، این چالشها را برطرف خواهد ساخت. هر گره، مسئول مدیریت بخشی از دادهها و اطمینان از یکپارچگی و در دسترس بودن آن است. نویسندگان از یک سیستم ذخیرهسازی سلسله مراتبی برای سازماندهی دادهها در لایهها استفاده میکنند که امکان پرس و جو و بازیابی کارآمد دادهها را فراهم میکند.
تمرکززدایی: دادهها به صورت غیرمتمرکز ذخیره و مدیریت میشوند، که باعث میشود در برابر نقاط شکست منفرد مقاومتر شوند و اطمینان حاصل شود که هیچ نهاد واحدی بر کل سیستم کنترل ندارد.
فنآوری دفتر کل توزیع شده (DLT): استفاده از DLT امکان ثبت امن، شفاف و غیرقابل تغییر تراکنشها و به روز رسانی دادهها را فراهم میکند.
سیستم ذخیرهسازی سلسله مراتبی: در پژوهشی که انجام گرفته [3]، یک سیستم ذخیرهسازی سلسله مراتبی پیشنهاد شده است که دادهها را در لایههایی سازماندهی و امکان جستجو و بازیابی کارآمد دادهها را فراهم میکند.
یکپارچگی دادهها: بافت داده یکپارچگی دادهها را با استفاده از تکنیکهای رمزنگاری برای تأیید صحت و یکپارچگی دادههای ذخیره شده در هر گره تضمین میکند.
مقیاسپذیری: معماری به گونهای طراحی شده است که مقیاسپذیر باشد و به آن اجازه میدهد تا حجم فزایندهای از دادهها و ترافیک کاربر را مدیریت کند.
منابع
[1] Darmont.J., Novikov.B and Bellatreche.L; Advances on Data Management and Information Systems (2022), Information Systems Frontier, Springer Nature.
[2] Paptis.T.P, Passarella.A and Conti.M, Data Management in Industry: State of the Art and Open Challenges, IEEE Access, Vol7.
[3] Data Fabric: A New Paradigm for Data Management” by Muthanna Almashhedi, et al., IEEE Transactions on Industrial Informatics, Vol. 19, No. 1, 2023, pp. 363-374.