
پروژه انبار داده
در این فیلم آموزشی اتصال به انواع پایگاه های داده با نرم افزار ساخت (Dashboard) داشبورد tableau آموزش داده شده است.
محصول موسسه آموزشی PluralSight
مدت فیلم: 7 دقیقه و 33 ثانیه
فرمت: mp4
زبان فیلم: انگلیسی
امروزه با گسترش سیستم های پایگاهی و حجم بالای داده ها ی ذخیره شده در این سیستم ها، نیاز به ابزاری است تا بتوان داده های ذخیره شده پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد.
با استفاده ار پرسش های ساده درSQL و ابزارهای گوناگون گزارش گیری معمولی، می توان اطلاعاتی را در اختیار کاربران قرار داد تا بتوانند به نتیجه گیری در مورد داده ها و روابط منطقی میان آنها بپردازند اما وقتی که حجم داده ها بالا باشد، کاربران هر چقدرحرفه ای و با تجربه باشند نمی توانند الگوهای مفید را در میان حجم انبوه داده ها تشخیص دهند و یا اگر قادر به این کار هم با شند، هزینه عملیات از نظر نیروی انسانی و مالی بسیار بالا است.
نوع فایل ورد
تعداد صفحات 9
بنابراین میشود گفت که درحال حاضر یک تغییر الگو از مدل سازی و تحلیل های کلاسیک برپایه اصول اولیه به مدل های درحال پیشرفت و تحلیل های مربوط بطور مستقیم از داده ها وجود دارد.
داده کاوی یکی از مهمترین این روشها است که به وسیله آن الگوهای مفید در داده ها با حداقل دخالت کاربران شناخته می شوند و اطلاعاتی را در اختیار کاربران و تحلیل گران قرار می دهند تا براساس آنها تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند.
تعاریف داده کاوی
در متون آکادمیک تعاریف گوناگونی برای داده کاوی ارائه شده اند. در برخی از این تعاریف داده کاوی در حد ابزاری که کاربران را قادر به ارتباط مستقیم با حجم عظیم داده ها می سازد معرفی گردیده است و در برخی دیگر، تعاریف دقیقتر که درآنها به کاوش در داده ها توجه می شود موجود است.
چکیده:
پایگاههای داده فعال با هدف ایجاد تعامل در پایگاههای داده ایجاد شدند. در این نوع پایگاه داده با تعریف قوانین و بدون نیاز به کدنویسی، سیستم قادر به عکسالعمل مناسب در مقابل رویدادهای مهم در شرایط خاص میباشد. تعریف قوانین سادهترین نوع بیان محدودیتها بوده که برای متخصص های محیط نیز قابل درک میباشد. اما در بیان تجربیات اغلب از کلمات فازی استفاده میشود که ترجمه آنها به مقادیر دقیق منجر به کاهش ارزش معنایی دانش میشود. فازیسازی پایگاههای داده فعال با هدف نزدیکتر نمودن زبان بیان قوانین به زبان طبیعی انسان مطرح شد. این امر کمک میکند دانش متخصصین، مستقیماً به پایگاه داده منتقل شود. ضمن اینکه تغییرات نیز با کمترین هزینه، بر قوانین تعریف شده اعمال میشود.
اولین گروه فازیسازی گرداننده پایگاههای داده فعال ولسکی و بوعزیز و همکارانشان بودند که به فازی نمودن رویداد، شرط و واکنش در تعریف قوانین پرداختهاند و طی چند مقاله نتایج آن را ارائه نمودند، این گروه در پروژه Tempo به پیادهسازی فازی این سه بخش پرداختهاند.
گروه دومی که در این زمینه فعالیت نموده است گروه آقایان یوسل سایجین و اوزگور اولوسوی میجباشد که در دو مقاله به جنبه کاربرد تریگرهای فازی در پایگاه داده های فعال سیار پرداخته اند. فازی نمودن پایگاههای داده فعال با هدف کاربردیتر نمودن پایگاههای داده مطرح شد. این پایاننامه ضمن اصلاح تریگر های فازی معرفی شده توسط گروه اول با ایجاد تغییراتی در آنها از تریگر های فازی جهت عمل رونوشت برداری فازی استفاده می کند.
در ادامة این پایاننامه یک معماری ساده از موتور رونوشت برداری فازی در پایگاه داده فعال ارائه میشود و در پایان با یک نمونه پیادهسازی شده از موتور رونوشت برداری فازی موارد پیشنهادی ارزیابی میگردد.
۱-۱ مقدمه:
با ایجاد سیستمهای مدیریت پایگاه داده عمده مشکلات ساختار، پشتیبانی و مدیریت دادههای حجیم در سیستمهای فایلی برطرف شد اما توجهی به جنبههای رفتاری پایگاه داده نشد. به این معنا که با استفاده از قیود جامعیت شاید بتوان از منفی شدن مبلغ حقوق کارمندان جلوگیری نمود اما نمیتوان مانع از بیشتر شدن حقوق آنها از مدیرانشان شد. در چنین مواردی کاربران پایگاه داده با اجرای یک پرس و جو موارد نقض محدودیتهایی از این قبیل را پیدا نموده و خود اقدام به اصلاح آنها مینمایند. مواردی این چنین و نیز گزارشات مدیریتی در آغاز ماه از جمله کارهای مشخص و دارای ضابطهای میباشند که انجام آنها تکراری و قابل تفویض به سیستم است.
کاربران غیرمجاز با استفاده از یک سری گزارشات، غیرمستقیم به اطلاعات کلیدی دست یافته و اقدام به تغییر آنها مینمایند. پیدا نمودن چنین تغییراتی که معمولاً بعد از گزارشات اتفاق میافتند، به راحتی امکانپذیر نیست. همانطور که مشاهده میشود در یک پایگاه داده معمولی ردیابی رویدادهایی که در سیستم اتفاق افتادهاند (رخدادها) نیز ممکن نبوده و نیاز به یک سیستم با پشتیبانی جنبههای رفتاری میباشد. یک پایگاه داده فعال نظیر Oracle قادر به تشخیص رویدادهای نظیر اضافه، حذف و تغییر مقادیر در پایگاه داده میباشند. به عبارت دیگر این سیستمها با ایجاد تغییر در یک قلم داده عکسالعمل نشان میدهند.
پایگاه داده فعال با افزودن قوانین به پایگاههای داده امکان تعامل (کنش و واکنش) بین سیستم و پایگاه داده را ایجاد نمود. این نوع پایگاه داده دارای دو بخش مدیریت داده و مدیریت قوانین میباشد. بخش مدیریت داده مسئول حفظ خواص پایگاه داده در سیستمهای کاربردی بوده و بخش دوم با مدیریت قوانین مسئول واکنش به رویدادهای سیستم میباشد. در این نوع پایگاه داده طراحان سیستم قادرند با تعریف قوانین که نزدیکترین بیان به زبان طبیعی میباشد، سیستم را وادار به عکسالعمل مناسب در مقابل رویدادهای مهم نمایند.
پایگاه داده فعال با استفاده از قوانین قادر به «پشتیبانی گستردهتر قیود جامعیت و سازگاری دادهها، واکنش در مقابل رخدادهای سیستم کاربردی، عدم اجرای تقاضاهای مشکوک، ردیابی رویدادها، گزارشات ماهانه و…» میباشد. همانطور که گفته شد آنچه که به طور معمول باعث میشود یک پایگاه داده را فعال بدانیم، عکسالعمل سیستم در مقابل وضعیتهایی است که در پایگاه داده و یا حتی خارج از آن به وجود میآید. این وضعیتها میتواند شامل یک حذف غیرمجاز و یا تغییر وضعیت پایگاه داده باشد. باید توجه داشت که داشتن تعامل برای یک پایگاه داده لازم اما کافی نیست. بسیاری از سیستمهای پایگاه داده بدون رعایت اصول پایهای که در زیر به آن اشاره میشود به طور عام پایگاه دادة فعال نامیده شوند.
اینگونه سیستمها باید یک پایگاه داده باشند، یعنی در صورتی که کاربر فراموش کرد، سیستم مورد نظر پایگاه دادة فعال است بتواند از آن به عنوان یک پایگاه داده معمولی استفاده نماید (در صورت لزوم بتوان به عنوان یک پایگاه دادة معمولی از آن استفاده نمود). در اینگونه سیستمها باید امکان تعریف و مدیریت قوانین وجود داشته باشد. این قوانین در پایگاه داده فعال دارای سه جزء رویداد، شرط و واکنش میباشند. این سیستمها باید دارای یک مدل اجرایی باشند. به این ترتیب که با بروز رویداد و صحت شرط، واکنش قانون اجرا شود. یک پایگاه داده فعال باید قادر به آشکارسازی رویدادها و بررسی شرط قوانین فعال و اجرای فرامین واکنش باشد.
علاوه بر موارد فوق، بهتر است در این سیستمها محیط مناسبی برای تعریف و امکان کامپایل کردن قوانین فراهم شود که به کاربر در تعریف قوانین کمک کند. فازیسازی پایگاههای داده فعال با هدف نزدیکتر نمودن زبان بیان قوانین به زبان طبیعی طراحان مطرح شد. اغلب تقاضاهای کاربران پایگاه داده فعال، فازی میباشد. به عنوان نمونه در تقاضاهایی نظیر عدم تعلق پاداش به کارمندان «کمکار»، «افزایش» فشارخون، محاسبة حقوق کارمندان در «پایان» هر ماه و… از کلمات فازی استفاده شده است که عدم پشتیبانی مفاهیم فازی و به کار بردن مقادیر دقیق منجر به حصول نتایج نامطلوب در برخی سیستمهای کاربردی میشود.
تفاوت اصلی در فازیسازی پایگاه دادة فعال با سایر سیستمهای فازی، در نوع تعریف قوانین میباشد. به این ترتیب که در تعریف قوانین در اینجا از سه جزء اصلی رویداد، شرط و واکنش استفاده میشود در صورتی که سیستمهای مبتنی بر قانون عموماً از دو جزء شرط و واکنش تشکیل شدهاند اما فازی نمودن شرط و واکنش قوانین در پایگاههای داده فعال تفاوت چندانی با شرط و واکنش فازی در سیستمهای مبتنی بر قانون ندارد و در فازی نمودن رویداد نیز میتوان از همان سیاق رویدادهای فازی استفاده نمود این بحث توسط ولسکی و بوازیز در [۷] مطرح شده است.
در این پایاننامه سعی شده است بحثهای مطرح شده در پایگاههای داده فعال فازی، با یک نمونه پیادهسازی شده بطور خلاصه بررسی شود. همچنین در ادامه با معرفی عمل رونوشت برداری و بکار گیری قوانین فازی(تریگرهای فازی) در عمل رونوشت برداری روش بهبود یافته جدیدی معرفی شود..
۱-۲ مروری بر فصول پایاننامه:
در ادامه این پایاننامه در فصل دوم مفاهیم پایگاه دادة فعال ارائه شده است. همچنین مدل اجرایی، نمونههایی از این نوع پایگاه داده و برخی کاربردهای پایگاه دادة فعال در ادامة این فصل آمده است.
در فصل سوم مختصری از مفاهیم فازی ارائه شده است.
فصل چهارم شامل چگونگی پشتیبانی مفاهیم فازی در بخشهای مختلف یک پایگاه داده فعال میباشد.
فصل پنجم به بیان طرح استفاده از تریگرهای فازی در پایگاه دادة فعال جهت ارائه روش جدید رونوشت برداری فازی میپردازد و مزایا استفاده از روش رونوشت برداری فازی نسبت به روشهای مرسوم قدیمی با یک نمونه پیادهسازی شده و مقایسة آن با نمونة غیرفازی ارائه شده است.
فصل ششم به بیان چگونگی پیاده سازی تریگرهای فازی در پایگاه دادة فعال غیر فازی و نیز پیاده سازی رونوشت برداری فازی بوسیله آن می پردازد.
فهرست مطالب دانلود پایان نامه تریگر های فازی در پایگاه داده فعال:
بخش اول: مفاهیم و تعاریف، کارهای انجام شده
فصل اول: کلیات
۱-۱ مقدمه
۱-۲ مروری بر فصول پایاننامه
فصل دوم: پایگاه داده فعال
۲-۱ مدیریت داده
۲-۲ مدیریت قوانین
۲-۲-۱ تعریف قانون
۲-۲-۱-۱ رویداد
۲-۲-۱-۲ شرط
۲-۲-۱-۳ واکنش
۲-۲-۲ مدل اجرایی
۲-۲-۲-۱ اولویت اجرایی در قوانین
۲-۲-۲-۲ معماری پایگاه دادة فعال
۲-۲-۲-۳ آشکارساز رویداد
۲-۲-۲-۴ ارزیابی شرط
۲-۲-۲-۵ زمانبندی
۲-۲-۲-۶ اجرا
۲-۳ نمونههای پیادهسازی شده
۲-۳-۱ Starburst
۲-۳-۲ Ariel
۲-۳-۳ NAOS
۲-۴ نتیجه
فصل سوم: مفاهیم فازی
۳-۱ مجموعههای فازی
۳-۲ عملگرهای فازی
۳-۳ استنتاج فازی
۳-۴ ابهامزدایی
۳-۵ نتیجه
فصل چهارم : پایگاه داده فعال فازی
۴-۱ تعریف فازی قوانین
۴-۱-۱ رویداد فازی
۴-۱-۱-۱ رویدادهای مرکب
۴-۱-۱-۲ انتخاب فازی اجزاء رویدادهای مرکب
۴-۱-۲ شرط فازی
۴-۱-۳ واکنش فازی
۴-۱-۴ تعیین فازی موقعیت زمانبندی
۴-۲ معماری و مدل اجرایی قوانین
۴-۲-۱ آشکارساز رویداد
۴-۲-۲ بررسی شرط
۴-۲-۳ اجرا
۴-۲-۴ زمانبندی
۴-۳ نتیجه
بخش دوم: کاربردی جدید از تریگر فازی، رونوست برداری فازی، نتایج آزمایشات
فصل پنجم: رونوشت برداری فازی
۵-۱ رونوشت برداری
۵-۱-۱ رونوشت برداری همگام
۵-۱-۲ رونوشت برداری ناهمگام
۵-۱-۳ ماشین پایه رونوشت برداری داده
۵-۱-۴ مقایسه دو روش همگام و ناهمگام
۵-۲ رونوشت برداری فازی
۵-۲-۱ استفاده از تریگرها برای فازی نمودن رونوشت برداری
۵-۳ کمیت سنج های فازی
۵-۳-۱ روش محاسبه کمیت سنج های فازی
۵-۳-۲ کمیت سنج عمومی
۵-۳-۳ کمیت سنج جزئی
۵-۳-۴ کمیت سنج جزئی توسعه یافته
۵-۴ روش جدید محاسبه حد آستانه در تریگرهای فازی برای رونوشت برداری فازی
۵-۵ معماری ماشین رونوشت بردار فازی
۵-۶ مثال
۵-۷ کارایی
۵-۷-۱ ترافیک در رونوشت برداری مشتاق
۵-۷-۲ ترافیک در رونوشت برداری تنبل
۵-۷-۳ ترافیک در رونوشت برداری فازی
۵-۷-۴ مقایسه تئوری هزینه رونوشت برداری فازی و تنبل
۵-۸ جمع بندی
فصل ششم: پیاده سازی
۶-۱ Fuzzy SQL Server
۶-۲ عملکرد اجزای Fuzzy SQL Server
۶-۳ شبیه سازی تریگرهای فازی در پایگاه داده غیر فازی
۶-۴ اجزاء تریگر فازی در پایگاه داده غیر فازی
۶-۵ جداول سیستمی مورد نیاز
۶-۶ مثال
۶-۷ کارهای آتی
فرمت فایل : word (قابل ویرایش) تعداد صفحات : 51 صفحه
چکیده:
با افزایش سیستمهای کامپیوتر و گسترش تکنولوژی اطلاعات , بحث اصلی در علم کامپیوتر از چگونگی جمع آوری اطلاعات به نحوه استفاده از اطلاعات منتقل شده است . سیستمهای داده کاوی ,این امکان را به کاربر می دهند که بتواند انبوه داده های جمع آوری شده را تفسیر کنند و دانش نهفته در آن را استخراج نمایند .
داده کاوی به هر نوع کشف دانش و یا الگوی پنهان در پایگاه داده ها اطلاق می شود . امروزه داده کاوی به عنوان یکی از مهمترین مسائل هوش مصنوعی و پایگاه داده ، محققان بسیاری را به خود جذب کرده است . در این تحقیق ابتدا نگاه کلی بر داده کاوی ، استراتژیهای داده کاوی و... داریم ، سپس مسأله کشف قوانین وابستگی در پایگاه داده را به تفضیل بررسی کردیم و نگاهی به الگوریتمهای موجود برای آن داشتیم . سپس مسأله کشف قوانین وابستگی در پایگاه داده های پویا را مورد بحث قرار دادیم و الگوریتم های ارائه شده مربوطه را مطرح کردیم
مقدمه :
هدف از این اراِئه و تحقیق بررسی روشهای مطرح داده کاوی است .داده کاوی هر نوع استخراج دانش و یا الگواز داده های موجود در پایگاه داده است که این دانشها و الگوها ضمنی و مستتر در داده ها هستند ,از داده کاوی می توان جهت امور رده بندی (Classification ) و تخمین (Estimation) ,پیش بینی (Prediction) و خوشه بندی (Clustering)استفاده کرد .داده کاوی دارای محاسن فراوانی است . از مهمترین آن محاسن کشف کردن دانش نهفته در سیستم است که به شناخت بهتر سیستم کمک می کند .به عنوان مثال می توان به استفاده ترکیبی از روش خوشه بندی جهت تخصیص بودجه به دسته های مختلف از کتب اشاره کرد .
سیستمهای داده کاوی تقریبا از اوایل دهه 1990 مورد توجه قرار گرفتند . علت این امر نیز آن بود که تا آن زمان سازمانها بیشتر در پی ایجاد سیستمهای عملیاتی کامپیوتری بودند که به وسیله آنها بتوانند داده های موجود در سازمان خود را سازماندهی کنند . پس از ایجاد این سیستمها ,روزانه حجم زیادی از اطلاعات جمع آوری میشد که تفسیر کردن آنها از عهده انسان خارج بود . به همین دلیل , نیاز به تکنیکی بود که از میان انبوه داده معنی استخراج کند و داده کاوی به همین منظور ایجاد و رشد یافت .
بنابر این هدف اصلی از داده کاوی ,کشف دانش نهفته در محیط مورد بررسی است که این دانش می تواند شکلهای گوناگونی داسته باشد . دانش استخراج شده می تواند به فرم الگوهای موجود در داده ها باشد که کشف این الگوها منجر به شناخت بهتر سیستم نیز می شود . الگوهای استخراجی عموما بیانگر روابط بین ویژگیهای سیستم هستند بعنوان مثال در سیستم تجاری یک الگو می تواند بیانگر رابطه بین نوع کالا و میزان تقاضای آن باشد .
در این تحقیق داده کاوی مورد بحث قرار می گیرد . علل استفاده از داده کاوی و منابعی که داده کاوی بر روی آنها اعمال می شود ,علاوه بر این خلاصه ای از روشهای رایج داده کاوی ارائه شده است . تکنیکهای داده کاوی و قوانین وابستگی و الگوریتمهای موجود (Apriori , Aprior TID, Partition, Eclat ,Max Eclat , Vector ) و الگوریتم با ساختار Trie وfp grow و الگوریتمهای کاهشی مورد بررسی قرار می گیرند و در هر مورد مثالها , موارد کاربرد ,تکنیکها و نقاط قوت و ضعف مورد بررسی قرار گرفته اند .
ادامه...