کتاب داده کاوی برای برنامه نویسان

کتاب داده کاوی برای برنامه نویسان


کتاب داده کاوی برای برنامه نویسان نوشته‌ی ران زاچارسکی، در 8 فصل تاریخچه داده کاوی و هنر باستانی شمارش را مورد بررسی قرار داده است.

ران زاچارسکی (Ron Zacharski) در کتاب داده کاوی برای برنامه نویسان (A Programmer's Guide to Data Mining The Ancient Art of the Numerati‬)، یک مقدمه‌ی سریع و کاربردی ارائه می‌دهد تا بتواند ساختاری پایه در مورد داده کاوی برای شما ایجاد کند. بنابراین شما می‌توانید با مطالعه‌ی این کتاب خلأهای مطالعاتی خود را پر کنید.

این کتاب روش‌های گردآوری علایق و سلیقه‌های مردم، سابقه‌ی خرید آن‌ها و داده‌های دیگر را با بهره‌گیری از قدرت شبکه‌های اجتماعی (دوستان) تحلیل می‌کند تا توانایی شناسایی و استخراج چیزهای مرتبط را به دست آورید.

در جهانی که زندگی می‌کنید هر لحظه داده‌های زیادی ساخته می‌شوند که سرعت تولیدشان بسیار بالاست. داده‌کاوی فرآیند استخراج دانش از میان این داده‌هاست، به گونه‌ای که بتواند به یک کسب و کار، ارزش افزوده اضافه کند. برای مثال درحوزه‌ی پزشکی توسط داده‌های مختلف، می‌توان موفق به تشخیص هوشمند بیماری، قبل از ابتلای شخص شد.

در بخشی از کتاب داده کاوی برای برنامه نویسان می‌خوانیم:

امروزه، داده‌کاوی بر روی داده‌هایی در حد ترابایت خیلی هم غیر معقول نیست. گوگل بیش‌از 5 پتابایت (در حدود 5 هزار ترابایت) داده‌های وب را در اختیار دارد. در سال 2006، گوگل یک مجموعه داده شامل یک تریلیون کلمه را برای استفاده توسط جامعه‌ی علمی انتشار داد. آژانس امنیت ملی، اطلاعاتِ تماسِ چند تریلیون ارتباط تلفنی را نزد خود دارد. شرکت اَکسیوم (Acxiom)، شرکتی است که اطلاعاتِ مختلف را از 200 میلیون آمریکایی جمع آوری می‌کند (اطلاعاتی مانند، خرید توسط کارت‌های اعتباری، تماس‌های تلفنی، اطلاعات پزشکی، خرید و فروش و انتقال اتومبیل و غیره). این شرکت بیش از یک پتابایت داده در اختیار دارد.

رابرت اهارو (Robert O'Harrow)، نویسنده‌ی کتاب «هیچ جایی برای مخفی شدن وجود ندارد»، برای این‌که به ما کمک کند که بفهمیم یک پتابایت چقدر اطلاعات دارد می‌گوید: یک پتابایت از اطلاعات، مانند این است که کتاب مقدس (عهدین - یعنی عهد قدیم و جدید شامل 66 کتاب) را به اندازه 50000 مایل (تقریبا 80000 کیلومتر) پشت سر هم قرار دهیم. من معمولاً از نیومکزیکو تا ویرجینیا به اندازه‌ی 2000 مایل رانندگی می‌کنم. هنگامی که می‌خواهم تصور کنم کتاب مقدس در تمامی این مسیر به اندازه‌ی 2000 مایل قرار گرفته باشد، به نظرم مقدار بسیار زیاد و غیر قابل باوری از داده می‌رسد.

فهرست مطالب
فصل 1: مقدمه
فصل 2: سیستم‌های توصیه‌گر
فصل 3: پایش براساس اقلام
فصل 4: طبقه‌بندی
فصل 5: کمی بیشتر درمورد طبقه‌بندی
فصل 6: بیز ساده
فصل 7: پردازش متون بدون ساختار
فصل 8: خوشه‌بندی

مطالب مرتبط

تگ‌ها

مطالب پربیننده

پربیننده
آخرین مطالب

عضویت در خبرنامه