فرمت فایل اصلی:doc قابل ویرایش با نرم افزار ورد
چکیده:
در جامعه امروزی با توجه به پیشرفت علم پزشکی حجم داده های پزشکی به سرعت در حال افزایش هستند. برای تحلیل سریع تر و کارآمدتر این داده ها نیاز به ذخیره الکترونیکی این داده ها داریم. داده های مربوط به بیماری های ژنتیکی نیز از این دسته داده ها به حساب می آیند. با توجه به این مسئله می بایست پایگاه داده ای مناسب ذخیره و بازیابی این داده ها طراحی نماییم. با توجه به ماهیت داده های ژنتیکی و این مسئله که در مورد انتقال بیماری های ژنتیکی روابط بین افراد و تجزیه تحلیل آن مسئله مهمی به حساب می آید در این مقاله برای ذخیره و بازیابی این داده ها از مدل داده ی گرافی که یکی از زیر مجموعه های مدل داده های غیر ساخت یافته (NOSQL)است استفاده می نماییم. برای این کار ابتدا نیازها و پرس و جوهای مربوط به این مسئله را مشخص می کنیم و بر اساس آن مدل داده گرافی را طراحی می نماییم. برای ارزیابی مدل داده طراحی شده یک تیم متشکل از متخصصان ژنتیک نیز این مدل داده را بررسی کرده و نظر مساعد خود را در خصوص کاربرد این مدل داده برای بیماری های ژنتیکی بیان نمودند. هم چنین از نرم افزار Neo4j استفاده نمودیم که داده های مربوط به بیماری ژنتیکی تالاسمی را در آن ذخیره کرده و این مدل داده را بر اساس کارایی ذخیره سازی و بازیابی اطلاعات و زمان پرس و جوها مورد بررسی قرار دادیم که با توجه به زمان پرس و جوها و عدم پشتیبانی سایر مدل داده ها از روابط بین افراد، این مدل داده مدل مناسبی به شمار می آید.
فهرست مطالب
چکیده
فصل اول: مقدمه1
1-۱ پیشگفتار2
1- ۲ بیان مسئله3
1-3 اهمیت وضرورت انجام تحقيق6
1-4 جنبه جديدبودن ونوآوري درتحقيق7
1-5 اهداف مشخص تحقيق8
1-6 مروری برساختارپروژه 8
فصل دوم: مفاهیم9
2-1 مقدمه10
2-2 مدل داده چیست؟10
2-2-1 مدل های داده ساخت یافته12
2-2-1-1 مدل داده رابطه ای12
2-2-1-2 مدل داده شی گرا14
2-2-1-۳ مدل داده شی رابطه ای16
2-2-2 مدل داده ای غیرساخت یافته17
2-2-2-1 مدل داده ای کلید/ارزش19
2-2-2-2 مدل داده ای سندگرا21
2-2-2-3 مدل داده ای ستونی23
2-2-2-4 پایگاه داده های گراف24
عنوان صفحه
2-3 مدیریت داده ها29
2-4 داده های پزشکی30
2-5 کاربردهای مدیریت داده های پزشکی34
2-6 بیماری های ژنتیکی36
2-7 انتقال بیماریهای ژنتیکی37
2-8 آزمایشهای ژنتیکی38
فصل سوم: پیشینه تحقیق42
3-1مقدمه43
3-2 مدل داده رابطه ای برای بیماریهای همه گیری43
3-3 مدل داده شی رابطه ای برای بیمارستانها44
3-4مدل داده گرافی برای بیماری های همه گیری47
فصل چهارم: روش پیشنهادی48
4-1مقدمه49
4-2 موجودیتها53
4-3-صفات مربوط به هریک ازموجودیتها53
4-3-1انسان سالم53
4-3-2انسان ناقل54
4-3-3 انسان درمان شده54
4-3-4 انسان بیمار54
4-3-5پزشک55
عنوان صفحه
4-3-6بیماری55
۴-۳-۷علائم57
4-3-8 روشهای درمان58
4-3-9 دارو58
4-4مقادیرذخیره شده برروی یالها59
4-5تعیین قابلیتهای مدل داده60
4-5-1ایجادکردن60
4-5-2افزودن61
4-5-3به روزرسانی61
4-5-4حذف کردن61
4-5-5پرس وجو62
4-5-5-1پرس وجوهای وابسته به یک گره62
4-5-5-2پرس وجوهای مربوط به دوگره66
4-5-5-3پرس وجوهای بیش از دوگره68
4-6طراحی مدل داده70
۴-۶-۱ طراحیER70
۴-۶-۲ طراحی مدل گرافی72
فصل پنجم: ارزیابی75
5-1 مقدمه76
5-2 روش اول: گروه متمرکز77
۵-۲-۱ آشنایی باگروه متمرکز77
عنوان صفحه
۵-۲-۲ مزایای گروه متمرکز77
۵-۲-۳روش شناسی گروه متمرکز77
۵-۲-۴ ارزیابی به وسیله ی گروه متمرکز79
5-3 روش دوم: پیاده سازی عملی پایگاه داده79
5-3-1 نرم افزارنئوفرجی80
5-3-2 داده های موردنیاز80
5-3-3 ذخیره داده هادرپایگاه داده نئوفرجی81
5-4 نتایج83
فصل ششم:جمع بندی و کارهای آتی90
6-1 جمع بندی وکارهای آتی91
منابع97
فهرست جدول ها
عنوان صفحه
جدول (3-1) : پایگاه داده ی سنتی رابطه ای45
جدول (3-2) : پایگاه دادهEAV45
جدول(3-3) : یک شمای کلیازEAV46
جدول (5-1 ): زمان مربوط به پرس وجوهای مختلف85