Python连接MySQL操作

Python很强大啊,不用多说的……这里简单介绍一下其中的一个模块就是DB-API,也就是提供数据库应用编程接口的一个东西。
参考资料:Writing MySQL Scripts with Python DB-API
DB-API两层架构:顶层为所有的数据库引擎提供一个抽象的接口,底层包含特定数据库引擎的驱动等用于处理特定引擎云云。所以,在写Python脚本之前需要先装这个特定的驱动,比如MySQL,就需要安装MySQLdb模块。

第一步:MySQLdb Installation
详见(ubuntu10.04) MySQL-python-1.2.3

Continue reading

(ubuntu10.04) MySQL-python-1.2.3

Reference:net
1.mysql : sudo apt-get install mysql-server
2.other :
sudo apt-get install python-dev
sudo apt-get install libmysqld-dev
sudo apt-get install libmysqlclient-dev
3.MySQL-python-1.2.3.tar.gz
4.setup mysql-python:
shell>wget http://peak.telecommunity.com/dist/ez_setup.py
shell>sudo python ez_setup.py
shell>tar zxvf MySQL-python-1.2.3.tar.gz (Note:PATH)
shell>cd MySQL-python-1.2.3
Continue reading

Running TPC-H on MYSQL–loading data

系统版本:Ubuntu-10.04  &&  MySQL-5.1.41
[background]
tpc-h是决策支持数据库的基准测试,它包含了一整套面向商业的ad-hoc查询并发数据修改,强调测试的是数据库、平台和I/O性能,关注查询能力
tpc-h通过检查大量数据,执行复杂的查询操作,以及应答商业问题来展示决策支持系统的性能。tpc-h中的数据库查询要比典型的OLTP查询更加复杂。

tpc-h性能测试包括两部分:
能力(power)测试—能力测试将以连续的次序执行一个数据库查询流。
吞吐量(throughput)—吞吐量测试将执行多条并发的数据库查询流,而每条查询流同样以连续的次序执行查询。

TPC-H所报告的性能计量单位被称为“TPC-H复合式每小时查询性能单位”(TPC-H Composite Query-per-Hour Performance Metric – QphH@Size),反映的是系统处理查询的多方面能力,包括查询执行时选定的数据库大小、单个流提交查询时的查询处理能力,以及多个并发用户提交查询时的查询吞吐量。
TPC-H的价格/性能比计量单位的表达方式为$/QphH@Size。

[load data step by step]
注:实验只需单表,所以做部分删减操作,多表需要修改ddl文件,或者create table的.sql文件,本实验选择lineitem表,该表含有各种数据类型。
Continue reading

实验:建立五个词的识别系统(步骤以及结果显示)

(PS:只作为尝试,不保证正确)
系统简介:
HTK是隐马尔可夫模型工具箱,由剑桥大学工程系研发而成。该工具箱的目的是搭建使用隐马尔可夫模型。详见:http://htk.eng.cam.ac.uk/
搭建步骤:
a)      训练库创建:词汇集中的每个元素进行多次录制,且对相应词汇做好标签;
b)      声学分析:将波形数据文件转换为一系列系数向量;
c)      模型定义:为总词汇集中的每个元素定义一个HMM原型;
d)      模型训练:使用训练数据对每个HMM模型进行初始化、训练;
e)      任务定义:识别系统的语法(什么可被识别)的定义;
f)       未知输入信号识别;
g)      评估:识别系统的性能可通过测试数据进行评估。

Continue reading