بیگ دیتا چیست؟ (مقدمهای بر کلان داده)
در این مقاله، درباره بیگ دیتا (کلان داده) صحبت خواهیم کرد. در ابتدا، به بررسی اجمالی چیستی بیگ دیتا (کلان داده) میپردازیم، سپس کمی در مورد مهارتهای لازم برای موفقیت در این حوزه صحبت میکنیم، ابزارها و زیرساختهای بیگ دیتا (کلان داده) را بررسی میکنیم.
بیگ دیتا (کلان داده) دقیقا چیست؟
مفهوم داده از گذشتههای دور وجود داشته و برای چندین دهه مورد توجه بوده است. جملاتی مانند داده نفت جدید است یا داده مانند نفت خام است، ارزشمند است اما اگر تصفیه نشود قابل استفاده نیست را زیاد شنیدهایم.
جان نایسبیت، آیندهپژوه، میگوید:
ما برای اولین بار اقتصادی داریم که مبتنی بر یک منبع کلیدی به نام اطلاعات است که نه تنها تجدیدپذیر است، بلکه خود تولید میشود. مشکل ما تمام شدن این منبع نیست، بلکه غرق شدن در آن است.
مدتهاست که چنین جملاتی را میشنویم. دادهها برای چندین دهه برای کسبوکارها بسیار مهم بودهاند، اما تمرکز بر بیگ دیتا (کلان داده) نسبتا جدید است.
همانطور که از نام آن پیداست، بیگ دیتا (کلان داده) به حجم زیادی از دادهها اشاره دارد. در واقع، مؤسسه ملی استاندارد و فناوری میگوید که بیگ دیتا (کلان داده)، دادههایی هستند که از ظرفیت یا قابلیت روشها و سیستمهای رایانهای معمولی فراتر میروند.
حجم مطمئناً جنبه کلیدی بیگ دیتا (کلان داده) است، اما فقط به حجم مربوط نمیشود. وقتی در مورد بیگ دیتا (کلان داده) صحبت میکنیم، در مورد دادههایی با ساختار متفاوت، دادههایی که با سرعت متفاوتی ایجاد میشوند، ابزارهای مختلف برای تجزیه و تحلیل دادهها و مهمتر از همه، از دیدگاه مدیریتی، در مورد انواع مختلف سوالات تجاری که میتوانیم با آن پاسخ دهیم، صحبت میکنیم.
سه ویژگی اصلی بیگ دیتا (کلان داده)
یک راه برای درک بیگ دیتا (کلان داده)، از طریق سه ویژگی اصلی آن است: حجم، تنوع و سرعت.
حجم داده به این معنی است که ما در مورد ترابایت یا پتابایت داده صحبت میکنیم. به طور خلاصه، انواعی از دادهها که در لپتاپها و رایانههای شخصی ما جا نمیشوند و نمیتوانیم آنها را در اکسل باز کنیم و تجزیه و تحلیل کنیم.
تنوع به این واقعیت اشاره دارد که ما دیگر در مورد دادههای عددی ساختاریافته که میتوانید در صفحات گسترده اکسل تجزیه و تحلیل کنید صحبت نمیکنیم. ما در مورد دادههای بدون ساختار، یعنی دادههای متنی، صوتی، تصویری صحبت میکنیم که هوشمندی در آنها پنهان است و میخواهیم آن را استخراج کنیم.
سرعت به این ایده اشاره دارد که دادهها به طور مداوم در حال ورود هستند. آنها هر ثانیه و میلی ثانیه در حال جریان هستند و ما باید بتوانیم دادهها را تجزیه و تحلیل کنیم و در لحظه تصمیم بگیریم.
صحت دادهها: چهارمین ویژگی کلان داده
گاهی اوقات وقتی در مورد بیگ دیتا (کلان داده) صحبت میکنیم، یک ویژگی چهارم هم وجود دارد که صحت یا راستیآزمایی دادههای ورودی است.
صحت دادهها به این نکته اشاره دارد که دادهها از منابع متعدد میآیند و مانند گذشته تنظیم نمیشوند، بنابراین ممکن است دادههایی از پلتفرمهای رسانههای اجتماعی داشته باشید، به این معنی که محتوای تولید شده توسط کاربر ممکن است دقیقاً دادههای با کیفیتی نباشد، بنابراین باید آن را در نظر بگیریم. همچنین ممکن است ناسازگاری دادهها یا دادههای ناقص داشته باشیم و بنابراین صحت دادهها نیز به یک موضوع بسیار مهم و بخش جدایی ناپذیر بیگ دیتا (کلان داده) تبدیل میشود.
چرا بیگ دیتا (کلان داده) تا این حد مهم شدهاند؟
افزایش ظرفیت محاسبات و تغییر در تولید داده
دلیل این تأکید جدید بر بیگ دیتا (کلان داده) به دو چیز برمیگردد.
اول، ظرفیت محاسبات است. ظرفیت محاسبات به طور تصاعدی در حال رشد بوده است. توانایی ما در ذخیره و پردازش دادهها به طور تصاعدی در حال رشد است و این امر ابزارهای بیگ دیتا (کلان داده) را امروزه در دسترس قرار داده است که ۱۰ سال پیش به سادگی در دسترس نبودند.
دوم، تولید داده خود در حال تغییر است. در گذشته، دادهها به صورت متمرکز و محدود تولید میشدند. در مقابل، امروزه دادهها به صورت غیرمتمرکز تولید میشوند. محتوای زیادی توسط کاربران، به عنوان مثال مشتریان ما، تولید میشود. دادهها از دستگاههای تلفن همراه، دوباره از هر کاربر، تولید میشوند. این دادهها توسط هزاران حسگر که یک شرکت ممکن است در کارخانه تولیدی یا فروشگاههای خردهفروشی خود استفاده کند، تولید میشوند. همه این عوامل منجر به انفجار دادهها و در واقع تغییر در دادهها شده است.
بیگ دیتا (کلان داده) چگونه به مدیران کمک میکنند؟
مهمتر از همه، بیگ دیتا (کلان داده) چیزهایی را که یک مدیر میتواند انجام دهد تغییر میدهد. به طور خاص، بیگ دیتا (کلان داده) به مدیران این امکان را میدهد که سوالات جدیدی بپرسند که قبلاً نمیتوانستند بپرسند و همچنین به آنها کمک میکند به همان سوالات قدیمی بهتر پاسخ دهند.
در مورد توانایی پرسیدن سوالات جدید، مشکل یک مدیر بازاریابی را در نظر بگیرید که در تلاش است کمپین بازاریابی برای یک محصول جدید طراحی کند.
مدیر باید تصمیم بگیرد که بر چه ویژگیهای محصول تأکید کند. اگر تلفن باشد، مدیر باید تصمیم بگیرد که آیا باید در مورد عمر باتری تلفن صحبت کنیم یا در مورد طراحی شیک تلفن، یا در مورد رابط کاربری و کاربرپسند بودن آن، یا در مورد برند به طور کلی و ابتکارات اجتماعی و بشردوستانه خود در کمپینهای بازاریابی صحبت کنیم؟
اینها سوالاتی هستند که پاسخ دادن به آنها سخت است. در گذشته، آنها تا حدی با شهود و تا حدی با خدمات کاربر در مقیاس کوچک پاسخ داده میشدند.
اما اکنون یک مدیر بازاریابی میتواند به دادههای موجود در پلتفرمهای رسانههای اجتماعی نگاه کند و میتواند به دادههای توییتر و فیسبوک و سایر پلتفرمها نگاه کند و ببیند مشتریان ما واقعاً از چه جنبههایی از محصولات ما قدردانی میکنند و لذت میبرند. چه چیزی در دادههای پلتفرمهای رسانههای اجتماعی وجود دارد که نشان میدهد برند ما را از سایر برندها متمایز میکند؟
آنها میتوانند از این دادهها برای ایجاد دقیق پیامهای بازاریابی استفاده کنند. این ممکن است در گذشته امکانپذیر نبوده باشد، اما از طریق بیگ دیتا (کلان داده)ی که در پلتفرمهای رسانههای اجتماعی در دسترس هستند و میتوانیم آنها را در مقیاس بزرگ تجزیه و تحلیل کنیم، امکانپذیر است.
همچنین اشاره کردم که بیگ دیتا (کلان داده) به ما این امکان را میدهد که به همان سوالات قدیمی بهتر پاسخ دهیم.
به عنوان مثال، تشخیص تقلب در کارت اعتباری را در نظر بگیرید. تقلب در کارت اعتباری در صنعت خدمات مالی بیداد میکند و میلیاردها دلار برای این شرکتها هزینه دارد.
در گذشته تشخیص آن سخت بود و معمولاً خیلی دیر، مثلاً وقتی مشتری صورتحساب کارت اعتباری خود را میدید و به این نتیجه میرسید که یک تراکنش خاص جعلی است و با مرکز خدمات مشتریان تماس میگرفت و آن تراکنش را علامتگذاری میکرد، تشخیص داده میشد و سپس اصلاح میشد، اما این کار پس از وقوع انجام میشد و اغلب بازیابی پول از دست رفته سخت بود.
در مقابل امروزه با ابزارهای بیگ دیتا (کلان داده)، شرکتها میتوانند تراکنشها را در حین پرواز، درست پس از کشیدن کارت اعتباری مشتری روی ترمینال، تجزیه و تحلیل کنند.
ابزارهای بیگ دیتا (کلان داده) میتوانند آن تراکنش را تجزیه و تحلیل کنند و تعیین کنند که آیا جعلی است یا خیر.
این نه تنها به تشخیص سریعتر تقلب کمک میکند، بلکه به انجام آن در مقیاس بزرگ نیز کمک میکند که قبلاً به سادگی امکانپذیر نبود و این ارزش زیادی برای شرکتهای خدمات مالی ایجاد میکند.
کاربردهای بیگ دیتا (کلان داده) در صنایع مختلف
ارزش بیگ دیتا (کلان داده) فقط به شرکت خدمات مالی محدود نمیشود. ما کاربردهایی را در تعدادی از صنایع مانند مراقبتهای بهداشتی، آموزش، حمل و نقل و بسیاری دیگر میبینیم.
به عنوان مثال، اگر به مراقبتهای بهداشتی نگاه کنید، این روزها روند بزرگی در دستگاههای پوشیدنی وجود دارد، بسیاری از مصرفکنندگان دستگاههایی مانند Fitbit و غیره را میپوشند و این دستگاهها قادر به ثبت دادههایی در مورد ضربان قلب، الگوهای خواب، ورزش و بسیاری از جنبههای دیگر سبک زندگی روزانه ما هستند.
این نوع داده در نهایت به مصرفکنندگان کمک میکند تا اقدامات بهتری برای بهبود رفاه خود انجام دهند.
به طور مشابه، حمل و نقل را در نظر بگیرید. حسگرهایی در جادهها وجود دارند که میتوانند دادههای مربوط به الگوهای ترافیک، بسته شدن جادهها، تصادفات را ثبت کنند و اکنون این دادهها به صورت بلادرنگ در دستگاههای تلفن همراه ما در دسترس قرار میگیرند.
این به ما کمک میکند تا مسیر را بهتر برنامهریزی کنیم، به برنامهریزی کمک میکند و در نهایت اساس برنامههایی مانند Google Maps و بسیاری از سیستمهای نقشهبرداری دیگر است که بسیاری از ما روزانه از آنها استفاده میکنیم.
اینها تنها چند نمونه از کاربردهای دادههای بزرگ هستند.
حتما بخوانید:
کاربرد هوش مصنوعی مولد در صنعت گردشگری
هوش مصنوعیبیگ دیتا چیست؟ (مقدمهای بر کلان داده)
هوش مصنوعی۷ پرامپت هوش مصنوعی برای ارزیابی ایده کسبوکار
هوش مصنوعی