六月婷婷综合激情-六月婷婷综合-六月婷婷在线观看-六月婷婷在线-亚洲黄色在线网站-亚洲黄色在线观看网站

明輝手游網(wǎng)中心:是一個免費(fèi)提供流行視頻軟件教程、在線學(xué)習(xí)分享的學(xué)習(xí)平臺!

Marc數(shù)據(jù)格式與數(shù)據(jù)庫格式的轉(zhuǎn)化體會

[摘要]首先感謝CSDN上的djkhym(hym),給我的巨大的幫助,借鑒了他的程序的思路。 Marc(machine readable catalogue)數(shù)據(jù),機(jī)讀目錄數(shù)據(jù)。Marc格式和數(shù)據(jù)庫的轉(zhuǎn)化,...
首先感謝CSDN上的djkhym(hym),給我的巨大的幫助,借鑒了他的程序的思路。



Marc(machine readable catalogue)數(shù)據(jù),機(jī)讀目錄數(shù)據(jù)。Marc格式和數(shù)據(jù)庫的轉(zhuǎn)化,是圖書系統(tǒng)里的重要部分,也是核心技術(shù)。現(xiàn)在網(wǎng)上mar數(shù)據(jù)的資料很少,和數(shù)據(jù)庫的轉(zhuǎn)換的資料就更少了。。。。。我主要參考了《中國機(jī)讀目錄格式使用手冊》和hym的程序,為了以后大家少走彎路,所以我寫了這個體會。(呵呵,現(xiàn)在網(wǎng)上轉(zhuǎn)一條marc數(shù)據(jù)要2毛錢呢)

marc數(shù)據(jù)的基本格式,大家都可以在《中國機(jī)讀目錄格式使用手冊》中詳細(xì)的查詢。這里我簡單的說說。本Marc數(shù)據(jù)格式遵循GB/T 2901(ISO 2709)的標(biāo)準(zhǔn),擴(kuò)展名是.iso。如下是記錄marc的iso文件中的一行,也就是一條marc數(shù)據(jù)。

00806nam0 2200229 450 001000900000010003500009092002000044100004100064101000800105102001500113105001800128106000600146200003100152210003300183215001500216330020500231333008500436606000500521690000800526701001500534801002700549?S7240011? ­a7-5034-1525-8­b精裝­dCNY130.00? ­aCN­b01-724-0011? ­a20021211d2002 ekmy0chiy0121 ea? ­achi? ­aCN­b110000? ­ay z 000yy? ­ar?1 ­a鄧小平理論辭典­f李長福主編? ­a北京­c中國文史出版社­d2004.7? ­a0720­d16開? ­a本書是一部力求全面、系統(tǒng)、準(zhǔn)確反映鄧小平理論科學(xué)體系和檢索鄧小平理論重要觀點(diǎn),供廣大黨員、干部及群眾學(xué)習(xí)、研究、宣傳鄧小平理論的工具書。全書在反映、闡述鄧小平理論的同時,還涵蓋了馬克思列寧主義、毛澤東? ­a思想和“三個代表”重要思想的核心內(nèi)容,體現(xiàn)了科學(xué)社會主義理論一脈相承的發(fā)展脈絡(luò)。? ­a? ­a­v4? 0­a李長福主編? ­aCN­bS7240011­c20040709?



記錄結(jié)構(gòu):記錄頭標(biāo) 、地址目次區(qū) 、數(shù)據(jù)字段區(qū)、記錄結(jié)束符

00806nam0到450#是記錄頭標(biāo)(#代表空格)

001000900000到801002700549@是地址目次區(qū)(@代表字段分隔符IS2)

S7240011到20040709@是數(shù)據(jù)字段區(qū)

%是記錄結(jié)束符(%代表記錄結(jié)束符IS3)

具體的每一個字節(jié)都有特殊的含義,大家可以看書,我這里講講自己轉(zhuǎn)換的體會。

1. 字段長度的計算:0-4位是代表記錄的總長度,注意包含了空格和分隔標(biāo)志符。英文字符1位,中文字符2位。注意asp中l(wèi)en(“我”)結(jié)果是一位,故vb中這樣寫長度計算:LenB(StrConv(st1, vbFromUnicode)),再用format(str1,00000)來格式化輸出。

2. 幾個符號:

$:字字段標(biāo)識符IS1

@代表字段分隔符IS2

%代表記錄結(jié)束符IS3

這是人為的標(biāo)記,便于學(xué)習(xí)和觀看。在實(shí)際系統(tǒng)里一般用這幾個字符代替:

$--------chr(31)

@--------chr(30)

%--------chr(29)

還有個空格很重要,每個字段間的空格都是嚴(yán)格規(guī)定的,所以學(xué)習(xí)的時候用#來代表空格。如頭標(biāo):01071nam0#2200277###450#

3.地址目次區(qū)的理解:人為添加,和;的分隔,就很明顯了。

001,0013,00000;005,0017,00013;…………………………801,0022,00771@

這里001,0013,00000;是表示數(shù)據(jù)字段區(qū)的第一個字段,字段號:001,長度:0013,開始的位置:00000。后邊的類推,就是位置在加。

Dbtomarc的計算方法,先寫數(shù)據(jù)字段區(qū),再一個字段一個字段的算,可以開一個數(shù)組:Block(i, 3) , Block(i, 0)為標(biāo)識,Block(i,1)列為寬度,Block(i, 3)列位置,I是指字段的個數(shù)。

Marctodb就是反過來了。。先讀,在去截數(shù)據(jù)字段區(qū)。

地址目次區(qū)一定要算對,否則電腦可不認(rèn)識,后邊的數(shù)據(jù)就錯位了。

4.數(shù)據(jù)字段區(qū):

按字段一個個的寫入(讀出)就可以了。注意一點(diǎn):

012001022343@20020928000000.0@##$a7-80142-191-4$dCNY46.00@…………………………………………@%

就是空格個數(shù)和分隔符號的使用,一定要注意,否則格式就錯了,不能機(jī)讀,這可是我的教訓(xùn)啊。。。。

5,將轉(zhuǎn)換的數(shù)據(jù)庫字段作成配置文件,可以選擇的轉(zhuǎn)換,便于程序的通用。

和編輯約定規(guī)則,如數(shù)據(jù)庫記錄中:書名[版次]、書名<叢書>這樣獲取版次,判斷是否是叢書。還有是就編著者不超過3個……看你程序設(shè)計的通用性了。

6.拼音的實(shí)現(xiàn),我是查的數(shù)組實(shí)現(xiàn)的,不知道有沒其他的好辦法。。。

7.再說一點(diǎn)就是,這種數(shù)據(jù)轉(zhuǎn)化重要的是吃透格式的要求,其他的算法就是查詢寫入,看你的功底了。我喜歡利用數(shù)組,呵呵。。。




主站蜘蛛池模板: 婷婷久久综合网 | 一二三四免费观看在线影视大全 | 欧美又大又粗又长又硬 | 欧美综合精品 | 色老头网站久久网 | 五月婷婷伊人 | 欧美亚洲国产精品久久第一页 | 日本一区二区三区在线 观看网站 | 先锋资源中文 | 一区二区三区视频免费观看 | 五月婷中文字幕 | 日本小视频在线 | 欧美首页| 在线国产资源 | 欧洲毛片| 伊人网在线观看 | 午夜痒痒网 | 日本免费一区二区三区a区 日本免费一二三区 | 日韩福利视频精品专区 | 青草草在线视频 | 欧美中文在线观看 | 日本免费色网站 | 午夜视频在线观看182tv | 欧美性xxxxbbbb| 最近免费韩国高清在线观看 | 三级国产日产 | 日韩三级毛片 | 人人干网站 | 青草网| 自拍偷拍3p | 中文字幕乱偷乱码亚洲 | 视频自拍网 | 青草伊人网| 欧美一区二区三区成人看不卡 | 又粗又大又爽又紧免费视频 | 亚洲日韩中文字幕一区 | 午夜精品一区 | 欧美特黄特色aaa大片免费看 | 四虎最新视频 | 日本在线精品 | 人人狠狠综合88综合久久 |