پیوندهای مفید مرتبط :
سومین کنفرانس داده کاوی ایران ،
موسسه پژوهشی داده پردازان گیتا ،
تغییر روند توجه سازمانها از منابع مالی به سرمایههای انسانی، فراهم آمدن زمینههای تراكم و حتی انفجار اطلاعات از طریق فناوری اطلاعات و ارتباطات در سازمانها، الزام و اهمیت مدیریت دانش را بیش از گذشته به رخ كشیده است. استخراج اطلاعات مناسب از میان انبوه دادهها و تبدیل آنها به دانش مورد نیاز سازمان، بویژه در تصمیمگیریهای سازمانی، نیازمند استفاده از روشهای نوین در این حوزه است. دادهكاوی1 یكی از این ابزار و رویكردهاست كه در فضای مدیریت دانش سازمانها به كشف دانش از پایگاه دادهها كمك میكند.
نویسنده : مسعود بینش
مدیریت دانش
امروزه در عصر یادگیری، كاركنان را ارزشمندترین منبع سازمان بهشمارمیآورند. كاركنان، حجم عظیم دادهها، اطلاعات و دانش سازمان را تولید كرده و بهكار میبندند. از اینرو در سازمانهای نوین، همكناری مدیریت دانش و مدیریت منابع انسانی، به امری ضروری تبدیل شده است. مدیریت دانش، رویكردی سیستمی و یكپارچه است كه تمامی داراییهای اطلاعاتی سازمان، اعم از: مستندات، پایگاه دادهها، خطیمشیها، رویهها و تجربیات كاركنان و سازمان را در برمیگیرد و به اشتراك میگذارد. مدیریت دانش، سكوی تسهیل كننده استخراج، ذخیرهسازی، یكپارچه سازی، انتقال، مشاهده، تجزیه و تحلیل و استفاده از دانش در سازمان است. مدیریت دانش به منظور حفظ، تجزیه و تحلیل، سازماندهی، بهبود و تسهیم تجارب كسب و كار، بهعنوان ابزار، روش و راهبرد در سازمان بهكارمیرود. در واقع، مدیریت دانش متدلوژی استخراج سیستمی و استفاده از دانش در سازمان است كه از طریق همین دانش و سرمایه فكری، ثروت و ارزش میآفریند. در نگرش سیستمی به مدیریت دانش، سه مؤلفه اصلی: منابع انسانی، فرایندها و فناوری دخالت و با یكدیگر همپوشانی دارند (شكل 1).
شكل 1
نسبت مدیریت دانش و دادهكاوی
برای بهكارگیری مدیریت دانش در سازمان، از ابزار متفاوتی استفاده میشود كه یكی از مهمترین آنها، دادهكاوی است. هنگامی كه طراحی مجدد فرایندهای كسب و كار (BRP) مورد نظر است، دادهكاوی به عنوان تكنیك، در خدمت مدیریت دانش قرار میگیرد. در هر بنگاه صنعتی، اقتصادی و تجاری نیز دانش با ارزش در مورد مشتری، محصول و بازار را میتوان از طریق دادهكاوی بهدست آورد. با بزرگتر شدن حجم دادهها و اطلاعات سازمانها، اهمیت این مسئله روزبهروز بیشتر میشود. هنگامی كه حجم دادهها زیاد است، برای مدیریت آنها از سیستمهای پایگاه دادهها (DBS/DBMS) استفاده میشود. در حالت زیاد بودن حجم دادهها، دادهكاوی برای استخراج و به دست آوردن دانش بهكار میآید. هنگامی كه حجم دانش زیاد است، از سیستم مدیریت دانش (KMS) استفاده میشود.
دادهكاوی
پیشینه طرح موضوع دادهكاوی به دهه 1980 و به صورت جدی، به دهه 1990 برمیگردد. پیش از آن از سیستمهای جمعآوری و مدیریت دادهها و اصطلاحاً لایروبی دادهها استفاده میشد، اما به مرور زمان، استخراج و كشف سریع و دقیق اطلاعات با ارزش و پنهان از پایگاه دادهها، به عنوان دادهكاوی مورد توجه قرار گرفت. به این شكل بود كه فرایند دادهكاوی به عنوان فرایند آماری و تجزیه و تحلیل در فرایند كشف دانش در پایگاه دادهها (KDD)3 پررنگ شد، به حدی كه گاه، دادهكاوی (DM) به عنوان مترادف كشف دانش در پایگاه دادهها (KDD) مورد استفاده قرار میگرفت.
امروزه فرایند استخراج اطلاعات معتبر، از پیش ناشناخته، قابل فهم و قابل اعتماد از پایگاه دادههای بزرگ و استفاده از آن در تصمیمگیری و در فعالیتهای تجاری دادهكاوی نامیده میشود. در تعاریف متعدد و متنوع برای دادهكاوی بر موضوعاتی نظیر: استخراج دانش كلان، كاوش در دادهها، تجزیه و تحلیل دادهها و یافتن روابط و الگوهای مطمئن بین دادهها تأكید میشود. هدف نهایی دادهكاوی، ایجاد سیستمهای پشتیبانی تصمیمگیری سازمانی است. دادهكاوی، به استخراج اطلاعات مفید و دانش ا ز حجم زیاد دادهها میپردازد. دادهكاوی، الگوهای حاوی اطلاعات را در دادههای موجود جستوجو میكند. این الگوها و الگوریتمها، میتوانند توصیفی باشند، یعنی دادهها را توصیف كنند و یا جنبه پیشبینی داشته باشند، یعنی متغیرها برای پیشبینی ارزشهای ناشناخته سایر متغیرها بهكار روند. دادهكاوی توصیفی، به دنبال یافتن اگرها در فعالیتها یا اقدامات گذشته است و دادهكاوی پیش بینانه با نگاه به سابقه، رفتار آینده را پیشبینی میكند.
دادهكاوی چیست و چه نیست
موارد زیر در حوزه دادهكاوی قرار میگیرند:
* استخراج یا كاوش دانش از میان حجم عظیم دادهها
* استخراج اطلاعات و مدل كردن الگوهای پنهانی در میان انبوه دادهها
* استخراج اطلاعات غیر منتظره، ناشناخته و بالقوه مفید از دادهها
* استخراج اطلاعات یا الگوهای مفید و جالب از دادهها در پایگاه دادههای بزرگ
موارد زیر در محدوده دادهكاوی قرار نمیگیرند:
* انبارش دادهها
* پردازش قیاسی دادهها
* سیستمهای خبره (ES)
* فرایند تجزیه و تحلیل مستقیم
* ابزار تجزیه و تحلیل آماری
* مشاهدهگری دادهها
حوزههای دادهكاوی
دادهكاوی در سه حوزه مستقل بهكار میرود و در آنها ریشه دوانده است:
1. آمار كلاسیك و الگوهای آماری
2. هوش مصنوعی
3. یادگیری خودكار و شبكههای عصبی
در دادهكاوی، هوش مصنوعی، یادگیری خودكار، تئوری پایگاه دادهها و علم آمار در هم آمیخته شده است. برای انجام دادهكاوی از ابزار مختلف نظیر: تفكیك كردن، دستهبندی، درخت تصمیمگیری، تحلیل قواعد وابستگی، تحلیل خوشهها و الگوریتمهای عمومی استفاده میشود (شكل 2).
مراحل فرایند
هدف دادهكاوی، تجزیه و تحلیل اكتشافی دادهها، كشف الگوها و قواعد و الگوریتمها، مدلسازی پیشبینانه و جستوجوی انحرافات است. برای انجام این هدف، فرایند دادهكاوی در جهت كشف دانش در مراحل مختلف انجام میشود (شكل3) كه عبارت است از:
1. اولین گام در دادهكاوی، شناسایی هدف و فهم حوزه كاربرد آن است و مشخص میكند كه چه كاری، در چه حوزهای انجام خواهد شد.
2 . انتخاب دادهها یعنی تعیین اهداف برای تجزیه و تحلیل و كشف آن
3 . آمادهسازی دادهها شامل تمیزسازی دادهها
4 . اتخاذ بهترین روش دادهكاوی برای دستیابی به اهداف
5 . اجرای دادهكاوی یعنی به كارگیری الگوریتم
6 . ارزیابی و اعتبارسنجی یافتهها
7 . استفاده از نتایج و تثبیت و تحكیم دانش كشف شده
8 . تصمیمگیری براساس دانش كشف شده
طراحی سیستم دادهكاوی
اگر از دادهكاوی برای مهندسی مجدد كسب و كار استفاده شود، مراحلی كه ذكر شد به صورت زیر قابل استفاده خواهند شد:
1. فهم و درك كسب و كار شامل تعیین اهداف كسب و كار، ارزیابی موقعیت، تعیین هدف دادهكاوی و طرح پروژه.
2. فهم و درك داده شامل جمعآوری دادهها، توصیف دادهها، كیفیت داده و صحهگذاری، آنالیز اكتشافی دادهها.
3. آمادهسازی داده شامل انتخاب، ساخت و انتقال متغیرها، یكپارچهسازی و فرمتدهی دادهها
4. ساختن مدل و صحهگذاری شامل طرح اولیه، ساخت مدل و ارزیابی مدل
5 . ارزیابی و تغییر شامل ارزیابی نتایج، فرایند بازنگری و تعیین مراحل بعدی
6 . جاریسازی شامل اجرای طرح، تدوین گزارش نهایی، پایش و نگهداری طرح و بازنگری آن
موانع و چالشها
با وجود مزایای فراوان كه دادهكاوی برای مدیریت دانش سازمانها و دستیابی به دانش برای تصمیمگیری سازمانی دارد، این حوزه با موانع و چالشهایی روبهروست كه عبارتند از:
1. فقدان داده برای پشتیبانی تجزیه و تحلیل
2. قدرت محدود محاسبه برای به دست آوردن محاسبات ریاضی مورد نیاز الگوریتمهای دادهكاوی
3. عدم مطلوبیت و جذابیت بیشتر الگوها
4. خطر وجود دادههای آلوده و كسب نتایج كاملاً غلط
5 . تمركز بیش از حد بر الگوریتمها
6 . هزینه نسبتاً گران سرمایهگذاری در همه حوزهها
7 . عدم پوشش كامل همه حوزهها
كاربرد دادهكاوی
امروزه دادهكاوی در حوزههای بسیار متنوع و متفاوت استفاده میشود:
حوزه علم: شیمی، فیزیك، داروسازی، تجزیه و تحلیل تصاویر پزشكی، تعیین نوع رفتار با بیماران و پیشگویی میزان موفقیتهای اعمال پزشكی، تعیین میزان موفقیت روشهای درمانی در برخورد با بیماریهای سخت، بیوشیمی، حسگرهای كنترل در اقمار مصنوعی، بیوعلم شامل توصیف ژنها و تقسیمبندی گروه پروتئینها و توسعه داروها.
خرده فروشی: تجزیه و تحلیل سبد خرید بازار، تعیین الگوهای خرید مشتریان
بانكداری: پیشبینی الگوهای كلاهبرداری از طریق كارتهای اعتباری، تعیین میزان استفاده از كارتهای اعتباری براساس گروههای اجتماعی
فروش و بازاریابی: تجزیه و تحلیل سهام و سرمایه، تعیین مشتریان وفادار، مدیریت ریسك و پیشبینی فروش
بیمه: تجزیه و تحلیل دعاوی و پیشگویی میزان جریمه بیمه نامههای جدید توسط مشتریان
دیگر حوزهها: ورزش و سرگرمی، فضانوردی و دیگر حوزههای علم.
پانوشتها:
1. Knowledge management
2. Data mining
3. Knowledge discovery in databases
منابع:
- ماهنامه صنعت خودرو ، شماره 136
1.
O. Folorunso, A. Ogunde; "The electronic journal of K.M.", vol. 2, 2004.
2. B. Fernandez/et. Al., "Knowledge management"; cho.12, 2004.
3. N. Balac; "Introduction to data mining", 2006.
پیغام بگذارید
لینک ثابت