الاختبار #2 أساسيات البيانات والمعلومات
2018-03-08
الاختلاف بين عالم البيانات و محلل البيانات
الفرق بين عالم البيانات و محلل البيانات
2018-04-22

ما هو علم البيانات؟

ما هو علم البيانات
شارك المعرفة
  •  
  •  
  •  
  • 369
  •  
    369
    Shares


البيانات هي “نفط القرن الواحد والعشرين”، هذا هو المصطلح الذي تم استخدامه للدلالة على أهمية البيانات في العصر الحالي. وكما في حالة النفط الخام، لا يمكننا استعماله والاستفادة منه إلا في حال تكريره. كذلك هي البيانات، لا يمكننا الاستفادة منها إلا في حال تنقيبها وتحليلها واستخراج ما ينفع منها ويفيد.

تزايد الاهتمام بعلم البيانات في نهاية عام 2012 بشكل ملحوظ من قبل الشركات من جهة، والأفراد الراغبين بتعلم هذه المجال من جهة أخرى. وتظهر هذه الصورة الماخوذة من Google Trends مدى ازدياد البحث عن هذا المصطلح خلال هذه السنوات. ومع تعدد المصادر التي تتولد منها البيانات ومعرفة الشركات لمدى أهميته، يتوقع العديد باستمرار هذا المجال لأكثر من خمس سنوات.


Data Science Trend

في البداية أود أن نقوم بفصل مصطلح “علم البيانات” إلى كلمتين منفصلتين والتعرف على كل واحدة منهم على حدى.

ما هو العلم وما هي منهجية البحث العلمي؟

“العلم هو المعرفة التي يتم التوصل لها من خلال الدراسة والممارسة والملاحظة المنظمة للأحداث والظروف الطبيعية من حولنا، من أجل اكتشاف حقائق عنها ومن أجل صياغة القوانين والمبادئ التي تعتمد على هذه الحقائق”

ويقوم العلماء باتباع المنهج العلمي في أبحاثهم والتي تتمثل خطواته بـ:

1-السؤال/المشكلة (Question/Problem)
2- الملاحظة/البحث (Observation/Research)
3-وضع الفرضية (Hypothesis)
4-التجربة (اختبار صحة الفرضية) Experimentation
5-التوصل إلى نتائج المعرفة العلمية (Conclusion)

لن نخوض في هذا المقال بالتفاصيل المتعلقة بكل خطوة، لكن من المهم معرفتهم بشكل عام حتى يتكون لديك/ي صورة عامة عن هذه المجال.

ما هو تعريف البيانات وما هي المعلومات؟

البيانات

هي مجموعة من الحروف أو الكلمات أو الأرقام أو الرموز أو الصور المتعلقة بموضوع معين.

المعلومات

هي البيانات التي تم تحليلها ومعالجتها بحيث أصبحت تحمل معاني مرتبطة بسياق معين.


الاختلاف بين البيانات والمعلومات

يوضح الشكل بالأسفل العلاقة بين عدة مفاهيم متعلقة بالبيانات، حيث تنتج المعلومات عند تحديد سياق (Context) البيانات. بينما تتشكل المعرفة عند تحليل المعلومات ومعالجتها وربط عدة معلومات مع بعضها البعض.
تتمثل المرحلة التالية ب فهم التحليلات/ التَبَصّر (Insights). وهي القدرة على فهم الحالة أو المشكلة بشكل دقيق وعميق ورؤيتها ودراستها من جميع الجوانب.

ففي المثال السابق يمكننا أن نتساءل عن سبب كون نكهة الفريز الأكثر مبيعاً بين النكهات الأخرى. فإن التعمق في هذا السؤال سوف يكشف عدة أمور اخرى لم نكن على علم بها مسبقاً وبنفس الوقت يساعد الإدارة في اتخاذ القرار المناسب.

المعلومات والبيانات

ما هو علم البيانات ؟

إن علم البيانات هو مجال واسع وخليط من عدة مجالات مرتبطة مع بعضها، يركز بشكل أساسي على معرفة وفهم البيانات التي تمتلكها شركة أو مؤسسة معينة واستخدامها لحل مشكلة أو الإجابة عن أسئلة معينة أو تقديم توصيات ونصائح للإدارة لتحسين العمل أو تجنب للمشاكل وكل ذلك باتباع المنهجية العلمية التي تحدثنا عنها سابقاً.

يوضح المخطط التالي كيفية الاستفادة من البيانات الموجودة لدى شركة أو مؤسسة معينة

مخطط البيانات

اكتشاف وفهم البيانات

يهتم هذا القسم في اكتشاف المعرفة داخل البيانات. لتمكين الأعمال من اتخاذ قرارات تحقق لهم فائدة أكبر!

حيث يعتمد بشكل كبير على علم الإحصاء (تحليل البيانات الكمي والنوعي).

لنتخيل أنه لدينا تطبيق موبايل لبيع الملابس يعمل على أجهزة الأيفون والاندرويد.

البيانات (Data): أطهرت لدينا انه خلال الشهر الماضي تم استخدام التطبيق من قبل 5000 مستخدم.

التحليلات(Analytics): يمكن استخدام التحليلات لإيجاد عدد المستخدمين الذين استعملوا التطبيق من خلال الايفون.

فهم التحليلات(Insights): من الممكن اكتشاف أن مستخدمي الايفون هم أقل احتمالاً للشراء عبر التطبيق بنسبة 40%.

الخطوة التالية تتمثل بمعرفة السبب وراء انخفاض نسبة التعاملات باستخدام اجهزة الايفون مقارنة بباقي الأجهزة.

هل يمكن أن يتعلق هذا الأمر بصعوبة وتعقيد واجهة استخدام التطبيق في الايفون؟
فإذا كان الأمر صحيحاً، فإن جعل واجهة الاستخدام بسيطة أكثر، سوف يرفع من احتمال عملية شراء المنتجات عبر المستخدمين الذين يملكون أيفون.

تطوير منتجات مرتبطة بالبيانات

يستخدم هذا القسم البيانات الموجودة لدى الشركة، كمدخلات إلى الخوارزميات والنماذج التي يقوم ببنائها “عالم البيانات”. يعتمد هذا القسم بشكل كبير على معرفة الشخص بعلم الحاسوب و خوارزميات تعلم الآلة والذكاء الصنعي.

هنالك العديد من المواقع التي نستعملها كل يوم والتي تعتمد على هذا المفهوم بشكل أساسي:

  • Google Search عندما تقوم بالبحث عن شيء معين، فإن محرك البحث غوغل لا يقوم بعرض النتائج المتعلقة بهذه الكلمة فقط، بل يستخدم جميع البيانات التي يمكن الحصول عليها من المستخدم لعرض أفضل نتيجة ممكنة. النتائج سوف تتعلق بالأمور التي قمت بالبحث عنها سابقاً، بمكانك الجغرافي ( في أي بلد أنت )، بتحليل الأمور التي تحبها. عمرك وجنسك، والعديد من الأمور الأخرى.
  • Spell Checking حيث يقوم غوغل بمراقبة الكلمات التي يقوم المستخدم بالضغط عليها حتى يقوم بتحسين الخوارزمية الخاصة بتصحيح الأخطاء الإملائية.
  • Gmail يقوم باستخدام خوارزمية معينة بتصنيف رسائل البريد الإلكتروني بين رسائل مهمة أو رسائل مزعجة.
  • Netflix يعد استخدام نظم التوصية Recommendation systems من أحد أهم الأمور الموجودة في هذا المجال، حيث تقوم بالاعتماد على اهتمامات المستخدم ونمط الأفلام التي يشاهدها، والأفلام الأخيرة التي شاهدها وجنسه وعمره، والتقييمات التي وضعها على الأفلام بتوصية أفلام جديدة من الممكن أن تعجب المستخدم.

 

الخاتمة

إن أي شركة أو مؤسسة تسعى إلى تحسين مستوى أدائها وزيادة أرباحها، فإن “علم البيانات” هو الحل. فإن أحد أهم الأسباب لنجاح الشركات الكبرى هو استخدامها للبيانات التي تمتلكها بأفضل طريقة.

ولقد تعرفنا في هذه المقالة على تعريف كلمة “البيانات” و كلمة “علم” بشكل مفصل. وأصبح لدينا تعريف واضح لعلم البيانات وكيفية توظيفه ليساعد الشركات في النمو.

هل تريد تثبيت المعلومات التي قرأتها في هذا المقال؟ اختبر معلوماتك من هنا

سعيد بالإجابة على جميع استفساراتكم عبر التعليقات. أو يمكنكم إرسال السؤال عبر صفحة الفيسبوك مباشرةً.

Eyad Al-Khayat

مهندس برمجيات، أعشق تحليل وتفسير البيانات لجعل الأعمال تتخذ قرارات أفضل. ومهتم بكل ما يتعلق بـ الذكاء الاصطناعي و تعلم الآلة.

المزيد من المقالات


تابعني على:
TwitterFacebookLinkedIn


شارك المعرفة
  •  
  •  
  •  
  • 369
  •  
    369
    Shares

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *