کلان داده یا بیگ دیتا چیست؟ (+کاربردهای Big Data)

پیش نیاز مطالعه درس کلان داده (بیگ دیتا)

  • مطالعه‌ درس داده و فراداده (دیتا و متادیتا)

از دوستان عزیز متممی انتظار می‌رود پس از مطالعه این درس بتوانند

  • مفهوم کلان داده یا بیگ دیتا را شرح دهند.
  • مدل‌های ۳V و ۴V را در تعریف کلان داده توصیف کنند.
  • بتوانند چند مثال از کاربردهای کلان داده را فهرست کنند.

فشار ذهنی هنگام مطالعه نیاز به مشارکت شما کسب و کار زندگی£

کلان داده یا بیگ دیتا (Big Data) را می‌توان یکی از اصطلاحات پُرتکرار در حرف‌ها و نوشته‌های مربوط به فناوری اطلاعات دانست.

اگر جستجوهای مربوط به کاربرد کلان داده را در گوگل بررسی کنید، می‌‌بینید که کاربرد کلان داده در پزشکی، اقتصاد، بانکداری و نیز حسابداری و حسابرسی، صرفاً بخش کوچکی از سوال‌ها و دغدغه‌های علاقه‌مندان این حوزه را به خود اختصاص می‌دهد.

همه‌ی ما با شنیدن بیگ دیتا یا کلان داده تا حدی می‌توانیم معنای آن را حدس بزنیم: ظاهراً بحث از حجم داده‌هاست. حجمی که هر روز نیز رو به افزایش است و هر یک از ما، در هر مقیاسی که فعال باشیم، جلوه‌هایی از آن را مشاهده و تجربه کرده‌ایم.

اما اجازه بدهید برای آشنایی با یک تعریف دقیق‌تر، به سراغ موسسه گارتنر برویم و تعریف گارتنر را از بیگ دیتا بخوانیم (+):

تعریف کلان داده (گارتنر)

بیگ دیتا (Big Data) به معنای دارایی‌های اطلاعاتی [یک مجموعه یا سازمان] است که:

  • حجم بالا دارند
  • با سرعت زیاد تولید می‌شوند و / یا تنوع گسترده دارند

و نیازمند شیوه‌های پردازش نوآورانه با هزینه‌ی مناسب هستند تا بتوان از آن‌ برای اتوماسیون فرایندها، تصمیم گیری و بهبود شهود و بینش [در سازمان] بهره گرفت.

در اغلب تعریف های کلان داده، سه اصطلاح حجم (Volume) و سرعت (Velocity) و تنوع (Variety) را می‌بینید. در حدی که گاهی برای تعریف بیگ دیتا از اصطلاح ۳V استفاده می‌کنند.

به عنوان مثال، شرکت PWC هم که از بزرگان مشاوره مدیریت در جهان است، بیگ دیتا را با همین ۳V تعریف می‌کند (+).

اکثر مقالات کتابِ راهنمای کاربردهای بیگ دیتا هم همین تعریف ۳V را مبنای بحث خود قرار داده‌اند (+).

فرانسیس باتل نیز در کتاب مدیریت ارتباط با مشتری خود، هنگامی که به بحث CRM تحلیلی می‌رسد، به سراغ همین الگوی ۳V می‌رود.

شرکت ارنست اند یانگ هم در راهنمای خود برای آشنایی با کلان داده، همین تعریف را مورد اشاره قرار داده و البته برای این‌که حرف تازه‌‌ای هم زده باشد، یک V چهارم هم به آن افزوده است (V چهارم، حرف اول Veracity است و به اهمیت دقیق بودن و قابل‌اتکا بودن داده‌ها اشاره دارد).

قاعدتاً با این توضیحات، باید قانع شده باشید که الگوی ۳V (یا ۴V) مدل رایج و شناخته‌شده‌ای برای تعریف بیگ دیتا است و اکنون می‌توانیم به سراغ تعریف دقیق‌تر این هر یک از این مولفه‌ها برویم.

تعریف کلان داده - در تعریف بیگ دیتا سه مولفه وجود دارد: سرعت - حجم و تنوع

شاید برای این کار، هیچ منبعی بهتر از یک مقاله‌ی قدیمی (سال ۲۰۰۱) که در آن این کلمات برای نخستین بار مطرح شده‌اند نباشد:

کاربردهای کلان داده

وقتی از بیگ دیتا صحبت می‌کنیم، بیشتر از یک وضعیت حرف می‌زنیم؛ وضعیتی که در آن حجم زیادی از داده‌ها، با سرعت زیاد و تنوع گسترده تولید می‌شوند.

اما این‌که از چنین وضعیتی چگونه می‌توان استفاده کرد، نیازمند دانش‌های دیگری است. دانشمندان علوم داده‌ها (Data Scientists)، متخصصان هوش مصنوعی (Artificial Intelligence) و فعالان داده کاوی (Data-mining) از جمله کسانی هستند که می‌توانند کاربردهای Big Data را در حوزه‌های مختلف بیابند و توسعه دهند.

بنابراین با وجودی که اصطلاح کاربردهای کلان داده (‌Big Data Applications) در فارسی و انگلیسی رایج است و ما هم آن را به‌کار می‌بریم، همواره به‌خاطر داشته باشید که منظور، کاربردهای تحلیل کلان داده‌هاست؛ وگرنه حجم و تنوع داده‌ها، به خودی خود کاربردی ندارد و اگر تحلیل و پردازش مناسب روی‌ داده های حجیم انجام نشود، این داده‌ها از منظر مدیریت منابع، با سایر منابع هرز سازمانی تفاوتی نخواهند داشت.

قاعدتاً پرداختن به جزئیات این کاربردها، بحثی تخصصی بوده و فراتر از حوزه‌ی تعریف شده برای درس سواد دیجیتال است. اما شاید نکات زیر بتواند سرنخی برای جستجوهای بیشتر و مطالعات کامل‌تر شما باشد:

از جمله کاربردهای بیگ دیتا در زندگی روزمره می‌توان به سرویس های مسیریابی مانند Waze و بخش Navigation در Google Maps اشاره کرد. حجم قابل توجهی از داده‌های مربوط به وسایل نقلیه‌ی در حال حرکت (در واقع: موبایل‌های در حال حرکت) به صورت پیوسته و در لحظه، پردازش می‌شوند و مسیرهای مناسب بر اساس مقصد تعیین شده و ترجیحات کاربران به آن‌ها پیشنهاد می‌شود.

در بحث مدیریت ارتباط با مشتری هم، CRM تحلیلی یکی از حوزه‌هایی است که کاربرد کلان داده در آن کاملاً مشخص است و مرور درس CRM تحلیلی می‌تواند در این زمینه کمی به شما دید بدهد.

اگر با بخش بندی بازار و بررسی رفتار مشتریان هم آشنا باشید، بی‌تردید می‌توانید تصور کنید که تحلیل بیگ دیتا چقدر می‌تواند مفید باشد و در این زمینه به کمک تصمیم‌گیران بیاید.

اگر با بحث شخصی سازی (Personalization) هم آشنا باشید، می‌توانید حدس بزنید که تحلیل داده‌ها در حجم بالا، چگونه می‌تواند به برنامه ریزی برای شخصی سازی خدمات کمک کند.

البته شخصی سازی خدمات، حتی بدون تحلیل کلان داده هم امکان‌پذیر است. اما وقتی گزینه‌های پیش روی شما زیاد و منابع‌تان محدود باشد، طبیعی است که شخصی سازی بر اساس تحلیل بیگ دیتا می‌تواند اثربخش‌ترین گزینه‌ها را (در مقایسه با هزینه‌ی هر گزینه) برای شما تخمین زده و برآورد کند.

سیستم های توصیه گر (Recommendation Engines) هم از جمله کاربردهای کلان داده در کسب و کارهای دیجیتال هستند و استفاده از Big Data در این زمینه، نتایج محسوس و ملموسی به همراه داشته است.

یکی از حوزه‌هایی که همواره در بحث بیگ دیتا مورد توجه بوده، حوزه پزشکی است. علل مختلفی را برای این مسئله می‌توان ذکر کرد:

  • اطلاعات عددی گسترده و متنوعی که می‌توان از بیماران به دست آورد (در مقایسه با حوزه‌‌های کیفی)
  • میل انسان‌ها به همکاری در حوزه‌ی سلامت (با این فرض که می‌تواند برایشان دستاوردهای مفید داشته باشد)
  • اپلیکیشن‌ها و ابزارهای متعددی که امروزه در حوزه‌ی سلامت استفاده می‌شوند و داده‌های فراوانی که تولید می‌کنند (فقط کافی است به سنسور شتاب‌سنج موبایل خود فکر کنید که در بخش زیادی از روز، حرکت‌های شما را ثبت می‌کند)

اما در بررسی کاربرد بیگ دیتا در پزشکی، مهم است که حوزه‌های مختلف را از یکدیگر تفکیک کنیم. مثلاً شاخه‌ی پیش بینی از جمله حوزه‌هایی است که امید نسبتاً بیشتری به‌ آن وجود دارد و پیشرفت‌های جالب‌توجهی هم داشته است (شاید پروژه‌ی Google Flu را بشناسید که هدف آن، پیش‌بینی آمار و روند شیوع آنفولانزا در نقاط مختلف، بر اساس میزان جستجوی کاربران بود).

شاخه‌ی عارضه‌یابی و Diagnose، دومین حوزه‌ای است که رشد محسوسی داشته است و امکان پردازش حجم زیاد تصاویری که از بیماران ثبت می‌شود، این امید را ایجاد کرده که بتوان در آینده فرصت‌های ارزشمندی برای عارضه‌یابی خلق کرد.

حوزه‌ی درمان و تصمیم گیری‌های مربوط به آن، دشوارترین شاخه است و هنوز، باید زمان زیادی منتظر بمانیم تا دستاوردهای محسوس آن را مشاهده و تجربه کنیم.

اگر علاقه‌مند به مطالعه‌ی بیشتر در زمینه کاربرد کلان داده در پزشکی و به‌طور کلی حوزه‌ی سلامت هستید، دو مقاله‌ی زیر می‌توانند نقطه‌ی شروع مناسبی باشند:

Big Data Revolution in Healthcare (PDF)

Big Data Analytics in Healthcare (PDF)

فایل اول توسط مک کنزی تهیه شده و کمی عمومی‌تر است. فایل دوم، بیشتر از نظر منابعی که معرفی کرده مفید است. اغلب رفرنس‌های معرفی شده، مطالب مفید و آموزنده و ساده‌ای دارند. البته طبیعی است هر دو فایل با در نظر گرفتن مخاطب مبتدی معرفی کرده‌ایم و اگر قصد داشته باشید به شکل تخصصی در این حوزه مطالعه کنید، باید به سراغ ژورنال‌های تخصصی‌ بروید.

سئو هم حوزه‌ی دیگری است که به صورت گسترده از تحلیل Big Data استفاده کرده و نتایج آن را نیز همه‌ی ما تجربه کرده‌ایم.

در تاریخچه سئو اشاره کردیم که عبور از دوران تکیه‌ی صِرف بر تحلیل کلمات کلیدی و رسیدن به الگوریتم های تحلیل رفتاری، باعث شده که روش‌های سنتی سئوی کلاه سیاه دیگر به سادگی اثربخش نباشند. بخش مهمی از این دستاورد را باید به توانایی تحلیل رفتار کاربران در مقیاس گسترده نسبت داد.

این روزها اگر هم سایت‌ها بتوانند با تکنیک‌های سیاه، جایی در رتبه‌های برتر نتایج جستجو به دست بیاورند، موتورهای جستجو (خصوصاً گوگل) به سرعت پس از فرستادن بازدیدکنندگان به این صفحات و بررسی رفتار آن‌ها، نامناسب بودن و کیفیت پایین این صفحات را ترجیح داده و نتایج خود را اصلاح می‌کنند.

طبیعتاً کاربرد کلان داده در حوزه‌های مختلف، بسیار فراتر از چند مورد محدودی است که در اینجا اشاره شد و در هر مورد، حتی کتابهای اختصاصی هم تألیف و منتشر شده است.

اما به طور کلی، باید به خاطر داشته باشید که Big Data هنوز بسیار جوان است و راهی بسیار طولانی در پیش است تا کاربردهای آن را به شکل تجاری و گسترده، در همه‌ی زندگی خود ببینیم و تجربه کنیم.

سری مطالب حوزه سواد دیجیتال

The post کلان داده یا بیگ دیتا چیست؟ (+کاربردهای Big Data) appeared first on متمم.