數(shù)據(jù)庫通用檢索技術(shù)與方法.ppt
《數(shù)據(jù)庫通用檢索技術(shù)與方法.ppt》由會員分享,可在線閱讀,更多相關(guān)《數(shù)據(jù)庫通用檢索技術(shù)與方法.ppt(21頁珍藏版)》請在裝配圖網(wǎng)上搜索。
數(shù)據(jù)庫通用檢索技術(shù)與方法,nbwangjt@,引言,恒變信息環(huán)境-----日新月異數(shù)據(jù)庫的檢索界面、檢索功能、版本形式經(jīng)常會有變化不變基本技術(shù)與基本原理方法或技巧,2,1信息檢索七準則,你得到什么檢索結(jié)果,取決于你怎么提問(即主題概念分析)去信息應該在的地方檢索(即選擇數(shù)據(jù)庫)向你的檢索結(jié)果提問――信息可能是真的,但內(nèi)容仍然會有錯的(檢索結(jié)果的判斷,內(nèi)容的選?。z索是一個多步驟的過程(擴檢、縮檢)檢索結(jié)果必須符合需求(檢索結(jié)果的選擇)咨詢圖書館員(獲得幫助)信息本身是無意義的,只有人提問之后才有價值(撰寫論文吧,讓信息增值)信息檢索準則編譯自:,3,2數(shù)據(jù)庫檢索常見問題,對信息檢索有畏懼心理不理解信息檢索過程或原理,無法做到觸類旁通。不知道選擇什么樣的數(shù)據(jù)庫檢索,到哪里檢索不知道如何選擇恰當?shù)臋z索詞在文摘索引數(shù)據(jù)庫中想下載全文僅僅用一個詞檢索(不會利用邏輯組配)在外文數(shù)據(jù)庫中輸入中文詞檢索,4,2數(shù)據(jù)庫檢索常見問題(續(xù)),信息環(huán)境意識不強,在網(wǎng)絡(luò)中搜索一個數(shù)據(jù)庫就進行檢索用整個論文(或課程)題名在題名項中檢索檢索結(jié)果太多(不會用限定和組配)檢索結(jié)果太少(課題分析不夠;檢索詞選?。z索結(jié)果的處理(排序、下載、閱讀器、復制)說說看,各位還有哪些問題?,5,3信息檢索“高級檢索”界面解讀,,4信息檢索途徑解析,信息檢索途徑也稱為信息檢索字段、檢索項。信息檢索的基本原理就是文本匹配。檢索途徑指定了輸入的關(guān)鍵詞進行匹配(比對)的范圍在檢索式的編寫中,如下表示:篇名=評價AND關(guān)鍵詞=信息資源配置,,,8,,,,,,,,,,檢索項/檢索途徑對應內(nèi)容,5信息檢索技術(shù)與發(fā)展,當前信息檢索是基于文本的可檢索字段信息以文本的形式存儲在數(shù)據(jù)庫(數(shù)據(jù)集合)中即使是多媒體數(shù)據(jù)庫,也是抽象特征進行文本化或說字符化基于文本的匹配技術(shù)是信息檢索的核心隨著信息技術(shù)的發(fā)展,以后還會有基于顏色、聲音、氣味、質(zhì)量等等的檢索。,9,5.1認識數(shù)據(jù)庫與數(shù)據(jù)庫檢索,數(shù)據(jù)庫是存儲在一起的相關(guān)數(shù)據(jù)(信息)的集合數(shù)據(jù)庫是信息檢索的主要對象,比如針對網(wǎng)絡(luò)信息資源的搜索引擎(谷歌、百度、雅虎)就是一個數(shù)據(jù)庫,文獻信息檢索領(lǐng)域的數(shù)據(jù)庫非常多。,10,5.2數(shù)據(jù)庫檢索,匹配技術(shù):有哪些匹配規(guī)則(模糊、精確、截詞)?數(shù)據(jù)庫檢索是一個多步驟的過程擴檢、縮減、檢索詞的選擇與邏輯組配數(shù)據(jù)庫的檢索也是一個知識的探索與發(fā)現(xiàn)的過程,別人沒法替代檢索、瀏覽、判斷、調(diào)整策略、再檢索花點時間,了解數(shù)據(jù)庫特點的必要性涵蓋學科或主題范圍文獻類型(出版形式、內(nèi)容層次)收錄年限,收錄對象數(shù)據(jù)量(記錄數(shù))文種全文獲取,5.3布爾邏輯檢索技術(shù),并且【邏輯與】表示當兩個詞都出現(xiàn)在檢索項中的時,這樣的文獻才被檢索出來。是縮檢的方法或者【邏輯或】表示只要其中一個詞出現(xiàn)在檢索項中,這樣的文獻就能檢索出來。是擴檢的方法去除【邏輯非】表示從已經(jīng)檢索的結(jié)果中去除含有該檢索詞的文獻。即檢索出的文獻包前面的檢索詞,但不包含去除的詞。是縮檢的方法,12,例:網(wǎng)絡(luò)信息資源評價研究綜述,網(wǎng)絡(luò)信息、信息資源、網(wǎng)絡(luò)信息資源、選擇、利用、評價(網(wǎng)絡(luò)信息OR信息資源)AND評價NOT檢索工具(網(wǎng)絡(luò)信息OR信息資源)AND(選擇OR利用OR評價)如何對應于數(shù)據(jù)庫的檢索?技巧:每一次檢索解決一個問題,即搜索到一個方面的信息資源。比如:網(wǎng)絡(luò)信息資源AND選擇網(wǎng)絡(luò)信息資源AND利用網(wǎng)絡(luò)信息資源AND評價,13,5.4截詞檢索技術(shù),截詞包括后截、中截、前截等。用?作為截詞符(有些系統(tǒng)用*),主要包括下列情形:截詞符?中截一字符,后截斷n個字符如wom?n可以檢索出:woman,women如coumput?可以檢索出Compute,Computer,Computing,computable,14,,??后、中截二字符如:transplant??可以檢索出:transplant、transplanted、transplanter???后、中截三字符如:comput???可以檢索出:compute;computer;computing,15,通配符,無限截斷,[%][?][*]后方一致(前截斷):“%國慶”將檢索出所有字段為張國慶、歐陽國慶、國慶等的記錄。前方一致(后截斷):如:“信息檢索%”將檢索出信息檢索原來、信息檢索技術(shù)等的記錄。,16,,截詞檢索是擴檢(即擴大檢索結(jié)果),17,5.5模糊檢索與精確檢索方法,模糊檢索系統(tǒng)根據(jù)檢索詞自動拆分成更小的單元詞如“網(wǎng)絡(luò)信息資源”模糊檢索,相當于用:網(wǎng)絡(luò)信息資源OR網(wǎng)絡(luò)信息OR信息資源OR網(wǎng)絡(luò)OR信息OR資源模糊檢索是一些數(shù)據(jù)庫(檢索系統(tǒng))的默認檢索模式。當檢索結(jié)果較少或檢索不到信息時,可以選擇模糊檢索。模糊檢索是擴檢(即擴大檢索結(jié)果)精確檢索與模糊檢索相對應,檢索詞不能拆分開精確檢索是縮檢(即縮小檢索結(jié)果,18,5.6限制檢索,19,主題領(lǐng)域限定年代限定文獻類型限定語種限定文獻層次限定……限制檢索是縮檢(即縮小檢索結(jié)果),如在谷歌和百度搜索引擎中的檢索特定的文獻類型:“報告filetype:pdf”檢索指定網(wǎng)址內(nèi)的信息:“報告site:”以后會看到一些數(shù)據(jù)庫通常都有年代/類型等的選擇,20,21,到“中國知網(wǎng)”期刊論文的高級搜索中,如何在檢索框中實現(xiàn)?主題=網(wǎng)絡(luò)信息資源AND(選擇OR評價)如何實現(xiàn)檢索2005年以來的論文?如何實現(xiàn)?篇名=網(wǎng)絡(luò)信息資源AND(選擇OR評價)如何實現(xiàn)?主題=(網(wǎng)絡(luò)資源AND網(wǎng)絡(luò)信息)AND篇名=(選擇OR評價),- 1.請仔細閱讀文檔,確保文檔完整性,對于不預覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認領(lǐng)!既往收益都歸您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 數(shù)據(jù)庫 通用 檢索 技術(shù) 方法
鏈接地址:http://zhongcaozhi.com.cn/p-3887451.html