خوشهبندی دادهها رو بر اساس شباهتی که دارن، به طوری که دادههای هر خوشه دارای بیشترین شباهت به هم و کمترین شباهت به دادههای خوشههای دیگه هستن، در یک خوشه قرار میده. الگوریتم K-Means یکی از الگوریتمهای مورد استفاده در داده کاوی و یادگیری ماشینی هست که برای خوشهبندی(Clustering) یا دستهبندی بدون نظارت از اون استفاده میشه. در ادامه نحوه کار این الگوریتم رو با یک مثال و پیادهسازی اون به کمک زبان جاوا توضیح میدم.
بایگانی دسته: آموزش
چطور کامپیوتر به جای شما کلیک کنه؟!
توی این پست راجع به نوشتن یه برنامه صحبت میکنم که میتونه به جای من روی یه نقطه از صفحه کلیک کنه. اما چه نیازی باعث شده که من سراغ درست کردن چنین برنامهای برم و به چه دردهایی ممکنه بخوره؟
داده کاوی و علم داده، ادامه مسیر من
تا این جای کار آموختههای من توی چهارچوب دانشگاه و استادهام بود و بیشتر روی سیستمهای توزیع شده و به ویژه روی محاسبات ابری مطالعه و تحقیق کردم.
همیشه دوست داشتم درباره داده کاوی هم مطالعه داشته باشم و حتّی یه روزی دانشمند داده بشم و الآن که دوره کارشناسی ارشدم به پایان رسیده، تا شروع دوره سربازی یه فرصت آزادی دارم که قصد دارم توی اون داده کاوی رو یاد بگیرم.
امّا داده کاوی چیه و به چه درد میخوره؟ دانشمند داده کیه و برای دانشمند داده شدن باید چه چیزهایی رو بدونیم؟
آموزش قدمبهقدم تولید گزارشهای فارسی از پایگاه داده MySQL به کمک زبان پایتون ۳.۵
به نام اندیشه پاک
در این آموزش قصد داریم بهصورت تصویری و قدمبهقدم، نحوه تولید یک گزارش که شامل متنهای فارسی است را به کمک پایگاه داده MySQL و زبان برنامهنویسی پایتون۳.۵ نشان دهیم.
کلیه کدهای منبع مثال ارائهشده از آدرس زیر قابل دریافت و استفاده هستند.
https://gitlab.com/pbarjoueian/report_python35
در این آموزش، برای گزارشگیری از پکیج(کتابخانه) reportlab استفاده میکنیم که یکی از قدرتمندترین کتابخانهها در این زمینه است و شرکتهای بزرگی مانند HP نیز از آن استفاده میکنند.
جریان کار چیست؟
جریان کار، گردش کار و یا Workflow عبارت است از:
مجموعهای از فعالیتها که برای تکمیل یک وظیفه لازم است. به بیانی دیگر، گردش کار به افراد درمستندسازی و مدیریت وظایف در پروژه ها کمک می کند و این امر با پیادهسازی فرایندهای کاری روی مستندات محقق میگردد.
جریان کار در حوزههای بسیاری از جمله محاسبات ابری کاربرد دارد و تعریف آن به صورت تخصصیتر در این حوزه به صورت زیر است:
محاسباتی سازمان یافته با تمرگز بر روی داده که دارای محاسبات منظم و الگوهای دسترسی به داده است