From Wikipedia, the free encyclopedia
مجموعه داده گل زنبق (به انگلیسی: Iris flower data set) یا مجموعه داده زنبق فیشر یک مجموعه داده چند متغیره است که توسط رانلد فیشر، آماردان و زیستشناس بریتانیایی در سال 1936 معرفی شد. این مجموعه داده همچنین مجموعه داده زنبق اندرسون نیز نامیده میشود.
این مجموعه شامل 150 نمونهی جمعآوری شده از گلهای زنبق است که این نمونهها 50 نمونه از هر یک از سه نوع گل زنبق را شامل میشوند. برای هر یک از نمونهها 4 ویژگی گل زنبق اندازهگیری شدهاست. این ویژگیها شامل طول و عرض کاسبرگ و گلبرگ، بر حسب سانتی متر است. بر اساس ترکیبی از این چهار ویژگی، فیشر یک مدل تشخیص خطی برای تفکیک کردن گونههای این گل از یکدیگر ایجاد کرد.
این مجموعه داده به عنوان یک مثال پرکاربرد در زمینههای آماری و یادگیری ماشین مورد استفاده قرار گرفتهاست.
از این مجموعه داده به عنوان یک مثال برای روش آنالیز افتراقی خطی فیشر استفاده میشود. همچنین این دادهها برای اعمال روشهای طبقهبندی آماری در یادگیری ماشین، همچون ماشین بردار پشتیبان مورد استفاده قرار میگیرند.
با این حال، این مجموعه داده در روشهای خوشهبندی معمولاً مورد استفاده قرار نمیگیرد. دلیل این مسئله آن است که دادههای موجود در این مجموعه هنگام نمایش در فضا فقط دو خوشهی مشخص از سه خوشه را نمایش میدهند و دادههای مربوط به دو کلاس در یک دسته خوشهبندی میشوند.
مجموعه داده گل زنبق، اطلاعات مربوط به سه نوع از گلهای زنبق از جمله زنبق نوکزبر، زنبق رنگارنگ و زنبق ویرجینیا را شامل میشوند که با اعمال خوشهبندی بر روی این مجموعه داده، یکی از خوشهها حاوی نمونههای مربوط به زنبق نوکزبر و خوشهی دیگر حاوی نمونههای مربوط به هر دو گونه زنبق رنگارنگ و زنبق ویرجینیا خواهد بود.
با این وجود هر سه گونهی این مجموعه داده با استفاده از نگاشت غیرخطی به فضایی دیگر، قابل تفکیک هستند.
مجموعه داده گل زنبق را با استفاده از کتابخانۀ Sickit-Learn در زبان برنامهنویسی پایتون میتوان به سادگی، بارگذاری و استفاده نمود.
from sklearn.datasets import load_iris
dataset = load_iris()
خروجی این قطعه کد به صورت زیر است که مقادیر موجود در مجموعه داده به ازای هر یک از نمونهها و اطلاعاتی راجع به مجموعه داده از جمله نام گونههای زنبق مورد استفاده، اسامی ویژگیها و ... است.
{'data': array([[5.1, 3.5, 1.4, 0.2],
[4.9, 3. , 1.4, 0.2],
[4.7, 3.2, 1.3, 0.2],
[4.6, 3.1, 1.5, 0.2],
[5. , 3.6, 1.4, 0.2],
[5.4, 3.9, 1.7, 0.4], ... ]),
'target': array([0, 0, 0, ... , 1, 1, 1, ... , 2, 2, 2, ... ]),
'frame': None,
'target_names': array(['setosa', 'versicolor', 'virginica'], dtype='<U10'), ... ,
'feature_names': ['sepal length (cm)',
'sepal width (cm)',
'petal length (cm)',
'petal width (cm)'], ... }
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.