داده و الگو یکی از شاخص های بسیار مهم در دنیای اطلاعات هستند. خوشه بندی(Clustering) یکی از بهترین روش هایی است که برای کار با داده ها ارائه شده. قابلیت آن در ورود به فضای داده و تشخیص ساختار آنها، خوشه بندی را یکی از ایده آل ترین مکانیزم ها برای کار با دنیای عظیم داده ها کرده است. اولین بار ایده ی آن در دهه ی ۱۹۳۵ ارائه شد و امروزه با پیشرفت ها و جهش های عظیمی که در آن پدید آمده، خوشه بندی در کاربردها و جنبه های مختلفی حضور یافته است.
یکی از اهداف مهم در داده کاوی، آنالیز هوشمند داده ها ، سنسور هسته ای ، تشخیص تصاویر و مدل سازی سیستم ها با محیط منطقی است .یک جستجوی ساده در وب یا حتی در پایگاه داده ی یک کتابخانه، کاربرد شگفت انگیز خوشه بندی را برای ما آشکار می سازد. خوشه بندی در علم پزشکی، بازاریابی، مهندسی، اقتصاد، علوم زیستی، شیمی، علائم نظامی، مهندسی تغذیه، سرمایه گذاری و تحصیلات خود را به طور شگفت انگیزی وارد کرده است . الگوریتم های خوشه بندی در زمینه های مختلفی کاربرد دارد. در میان همه الگوریتم های خوشه بندی، الگوریتم فازی جایگاه به خصوصی دارد. آنچه الگوریتم فازی را از سایر الگوریتم های خوشه بندی مجزا می سازد این است که در این جا یک داده می تواند همزمان به دو یا بیشتر خوشه تعلق داشته باشد.
خوشه بندی در واقع یافتن “ساختار” در مجوعه ای از داده هایی است که طبقه بندی نشده اند. به بیان دیگر می توان گفت که خوشه بندی قراردادن داده ها در گروه هایی است که اعضای هر گروه از زاویه خاصی شباهت دارند. در نتیجه اعضای یک خوشه به یکدیگر شباهت دارند و با اعضای خوشه های دیگر هیچ شباهتی ندارند. معیار شباهت در اینجا فاصله (distance) بوده یعنی اشیاء ای که به همین دیگر نزدیکترند در یک خوشه قرار می گیرند.
برای درک بهتر این موضوع میتوانید به لینک زیر مراجعه کنید:
http://en.wikipedia.org/wiki/K-means_clustering