lamp,weblucene,awstats

linux,mysql4,apache2,php4,Zend,eaccelerator,

java1.4,javacc,ant,resin2,weblucene,awstats的集合配置

自己学习linux也有一段时间了,基本上学习都是在工作和建站是边工作边学习的

下面算是做一下总结吧。

设计到的软件的版本:

mysql4.0.26

apache2.0.55

curl-7.14.0

freetype-2.1.1

gd-2.0.33

jpegsrc.v6b

libiconv-1.9.1

libmcrypt-2.5.7

libpng-1.2.8

libxml2-2.6.20

mhash-0.9.2

ZendOptimizer-2.5.10a

zlib-1.2.2

eaccelerator-0.9.3

php4.4.1

j2sdk1.4.0.28

resin2.1.17

weblucene

awstats

先来编译你的mysql

 
./configure --prefix=/usr/local/mysql --sysconfdir=/etc/ --with-mysqld-ldflags=-all-static --enable-assembler --disable-shared && make && make install
/usr/local/mysql/bin/mysql_install_db
然后为你的mysql增加一个启动用户
 
/usr/sbin/adduser mysql
 
更新mysql用户的密码
 
passwd mysql
 
编辑你的 /etc/passwd
 
把mysql用户的登陆shell从 /bin/bash 修改为 /sbin/nologin
 
修改相应的目录权限:
 
chown -R mysql /usr/local/mysql
 
cp /usr/local/mysql/share/mysql/my-medium.cnf /etc/my.cnf
 
/usr/local/mysql/bin/mysqld_safe --user=mysql &
 
在你的/etc/rc.local中加入:
 
/usr/local/mysql/bin/mysqld_safe --user=mysql &
 
这样就会随系统自动启动了。
 
其他可以参考的文章:
 
www.taoer.com/2005/10/31/mysql-different-port-start/
 
www.chedong.com/tech/mysql.html
 
然后来编译apache2:
 
./configure --prefix=/usr/local/apache2 --enable-log-config --enable-rewrite --enable-vhost-alias --disable-access --disable-include --disable-setenvif --disable-autoindex --disable-negotiation --disable-userdir --enable-deflate --disable-auth --disable-env --disable-asis --disable-cgi --disable-imap --disable-actions --disable-alias && make && make install
注意,如果你要在apache的配置文件里面执行 Order,Allow之类的命令
你需要将上面的 --disable-actions 修改为: --enable-actions
./configure --prefix=/usr/local/apache2 --enable-log-config --enable-rewrite --enable-vhost-alias --disable-access --disable-include --disable-setenvif --disable-autoindex --disable-negotiation --disable-userdir --enable-deflate --disable-auth --disable-env --disable-asis --disable-cgi --disable-imap --enable-actions --disable-alias && make && make install
如果要随系统自动运行,编辑你的/etc/rc.local
 
加入
 
/usr/local/apache2/apachectl start &
 
编译好apache2后先不用去管他,因为待会还要做修改。
 
现在开始为编译php做准备
 
因为我需要gd,libxml等包
 
所以需要先来编译这些dd
 
需要的包有:
 
curl-7.14.0
 
freetype-2.1.10
 
gd-2.0.33
 
jpegaltui.v6b
 
libiconv-1.9.1
 
libmcrypt-2.5.7
 
libpng-1.2.8
 
libxml2-2.6.20
 
mhash-0.9.2
 
zlib-1.2.2
 
curl编译:
 
./configure --prefix=/usr/local/curl && make && make install
 
libiconv编译:
 
./configure --prefix=/usr/local/libiconv && make && make install
 
libmcrypt编译:
 
./configure --prefix=/usr/local/libmcrypt && make && make install
 
libxml2编译:
 
./configure --prefix=/usr/local/libxml2 && make && make install
 
zlib编译:
 
./configure --prefix=/usr/local/zlib && make && make install
 
mhash编译:
 
./configure --prefix=/usr/local/mhash && make && make install
 
下面编译的是和gd2库相关的
 
libpng编译:
 
mv ./scripts/makefile.linux ./makefile
 
make && make install
 
freetype编译:
 
./configure --prefix=/usr/local/freetype && make && make install
 
jpeg编译:
 
./configure --enable-shared && make && make test && make install
 
如果编译过程中出现这样的错误:
 
/usr/bin/install: cannot create regular file `/usr/local/man/man1/cjpeg.1': No such file or directory
make: *** [install] Error 1
执行 mkdir /usr/local/man/man1
 
然后在重新编译
 
gd2编译:
 
./configure --prefix=/usr/local/gd2 --with-png --with-jpeg --with-freetype=/usr/local/freetype && make && make install
[CODE]
php编译:
 
[CODE]
./configure --prefix=/usr/local/php/ --enable-force-cgi-redirect --enable-mbstring=all --enable-mbregex --enable-mbstr-enc-trans --enable-versioning --enable-trans-sid --enable-ftp --with-mysql=/usr/local/mysql/ --with-apxs2=/usr/local/apache2/bin/apxs --with-soap=yes --with-curl=/usr/local/curl/ --with-zlib-dir=/usr/local/zlib/ --with-mcrypt=/usr/local/libmcrypt/ --with-gd=/usr/local/gd2 --with-jpeg-dir=/usr --with-freetype-dir=/usr/local/freetype --with-ttf --with-png-dir=/usr --with-mhash=/usr/local/mhash/ --with-dom=/usr/local/libxml2 --with-iconv=/usr/local/libiconv && make && make install
你还可以加上
 
--with-openssl=/usr/local/openssl 这个配置参数,如果你需要openssl支持的话。
 
编译成功后
 
cp ./php.ini-dist /usr/local/php/lib/php.ini
 
cd /usr/local/lib
 
ln -s /usr/local/php/lib/php.ini php.ini
 
安装Zend,这个就不用多说了
 
不过就是php4.4.1的版本需要ZendOptimizer-2.5.10a-linux-glibc21-i386版本的Zend来安装
 
接下来安装eaccelerator
 
/usr/local/php/bin/phpize
./configure --enable-eaccelerator=shared --with-php-config=/usr/local/php/bin/php-config
make
make install
编辑你的php.ini,在最后加入
 
;eaccelerator config
zend_extension="/usr/local/apache2/eaccelerator.so"
eaccelerator.shm_size="64"
eaccelerator.cache_dir="/tmp/eaccelerator"
eaccelerator.enable="1"
eaccelerator.optimizer="1"
eaccelerator.check_mtime="1"
eaccelerator.debug="0"
eaccelerator.filter=""
eaccelerator.shm_max="0"
eaccelerator.shm_ttl="0"
eaccelerator.shm_prune_period="3600"
eaccelerator.shm_only="1"
eaccelerator.compress="0"
eaccelerator.compress_level="0"
eaccelerator.keys="shm_only"
eaccelerator.sessions="shm_only"
eaccelerator.content="shm_only"
具体参数设置可以参考官方的说明
 
现在开始来安装java环境
 
先从sun的网站下载java的安装文件
 
是一个.bin的文件
 
下载后
 
chmod 700 j2sdk-1_4_2_08-linux-i586.bin
 
然后 ./j2sdk-1_4_2_08-linux-i586.bin
 
比如你要安装在/usr/local下
 
那么你就
 
cd /usr/local
 
然后去执行你的bin文件
 
看完sun的声明,输入一个yes
 
就搞定了。
 
下面就是来配置java的环境了
 
编辑你的 /etc/profile
 
在最后面加入如下内容
 
PS:这里加入的不光是java的环境,还有上面配置好的mysql,apache,php的环境,和下面将要配置的resin,weblucene,javacc,ant等环境。
 
#STMod
JAVA_HOME=/usr/local/j2sdk1.4.2_08
JAVA_BIN=$JAVA_HOME/bin
ANT_HOME=/usr/local/ant
ANT_BIN=$ANT_HOME/bin
JAVACC_HOME=/usr/local/javacc2.1
JAVACC_BIN=$JAVACC_HOME/bin
CLASSPATH=$JAVA_HOME/lib:$JAVA_HOME/lib/tools.jar
 
export JAVA_HOME
export CLASSPATH
export ANT_HOME
export JAVACC_HOME
 
RESIN_HOME=/usr/local/resin
RESIN_BIN=$RESIN_HOME/bin
export RESIN_HOME
export RESIN_BIN
 
APACHE_BIN=/usr/local/apache2/bin
MYSQL_BIN=/usr/local/mysql/bin
PHP_BIN=/usr/local/php/bin
 
export APACHE_BIN
export MYSQL_BIN
export PHP_BIN
 
PATH=$PATH:$JAVA_BIN:$ANT_BIN:$JAVACC_BIN:$RESIN_BIN:$APACHE_BIN:$MYSQL_BIN:$PHP_BIN
这样java的环境就配置好了
 
退出重新登陆,让你刚才的环境设置生效。
 
下面安装javacc
 
下面有部分来自于车东的开源项目 weblucene 里面的 BUILD.txt里面的指导。
 
从 JavaCC 项目的主页 javacc.dev.java.net/ 下载 JavaCC 2.1 版本
 
关于如何安装 JavaCC 2.1 请参考
 
see javacc.dev.java.net/doc/installhelp.html
 
如何找到旧版本的JavaCC
 
javacc.dev.java.net/files/documents/17/711/JavaCC2_1.class
 
命令行模式的安装:
 
java -cp ./ JavaCC2_1 -c
 
如果你要将你的javacc安装在/usr/local目录下
 
执行如下操作
 
cd /usr/local
 
cp /root/JavaCC2_1.class ./
 
这里的/root/JavaCC2_1.class是你的JavaCC2_1.class实际存在的路径
 
然后执行
 
java -cp ./ JavaCC2_1 -c
 
输入一个Y
 
然后回车一两次就好了。
 
从 ant.apache.org 下载Ant关于如何安装Ant的细节请参考 ant.apache.org/manual/index.html
 
PS:ant刚开始我下载了一个 xxxx-src.tar.bz2的文件来安装,但是后面用到weblucene的时候不成功
 
后来下载了apache-ant-1.6.5-bin.tar.bz2,这里还请注意一下。
 
设置环境变量
 
ANT_HOME=/usr/local/ant
 
PATH=$ANT_HOME/bin:$PATH
 
如果你要将ant安装在/usr/local下
 
mv /root/apache-ant-1.6.5 /usr/local/ant
 
这里的/root/apache-ant-1.6.5是你的解压缩ant后实际存在的路径
 
现在来安装resin2.1.17
 
注意这里一定要用 resin2.1.x
 
用resin3的版本对于weblucene会出现搜索后什么都不显示的问题。
 
这里安装要先安装openssl,因为我在编译resin的时候总是报错openssl找不到什么的。
 
所以我就先安装了openssl,然后在resin的configure的参数中指定openssl,如果有其他的解决方法,请告诉我 )
 
openssl编译:
 
./config --prefix=/usr/local/openssl && make && make install
 
编译resin:
 
如果你要将resin安装在/usr/local下
 
cd /usr/local
 
tar zxvf resin-2.1.17.tar.gz
 
mv resin-2.1.17 resin
 
cd resin
 
./configure --prefix=/usr/local/resin --with-apache=/usr/local/apache2 --with-openssl=/usr/local/openssl && make && make install
 
编译好resin后
 
做一些准备工作来让resin启动起来
 
resin的环境在上面配置java的时候已经一起给加上去了。
 
如果要让resin随系统自动运行
 
你需要做如下的操作
 
cp contrib/init.resin /etc/rc.d/
 
chmod +x /etc/rc.d/init.resin
 
下面修改你的 init.resin
 
找到文件中 start)
 
echo -n “Starting resin: ”
 
if test -n “$USER”; then
 
su $USER -c “$EXE -pid $PID start $ARGS”
 
else
 
$EXE -pid $PID start $ARGS
 
fi
 
在后面加入
 
sleep 15
 
然后在/etc/rc.local中加入
 
/etc/rc.d/init.resin start &
 
这样就ok了。
 
现在回过头来看咱们的apache吧,冷落了可爱的apache N年了
 
apache的httpd.conf的配置很惭愧一直都没有好好的看过,apache的模块也只是一知半解。
 
我就直接给出一个现成的httpd.conf来让大家参考吧,可以根据自己的需要再对比原来的httpd.conf来定制自己的httpd.conf
 
点击这里你可以查看或者下载最基本的httpd.conf
 
resin简单的配置虚拟主机:
 
咱们上面的resin是将resin作为apache2的一个模块来运行的,所以要先在apache2里面配置虚拟主机
 
关于apache2的一些配置,你可以 参考这里
 
然后在resin里面配置虚拟主机
 
比如要配置一个域名为 do1.domain.net
 
在resin里面最简单的配置为:
 
找到 /usr/local/resin/conf/resin.conf 里面的这样的一行
 
<!-- default host if no other host matches -->
<host id='do1.domain.net'>
    <web -app id='/' app-dir='/html/domain/do1'>
    </web> 
</host>
ok这样最基本的虚拟主机的配置就完成了。
 
/etc/rc.d/init.resin restart &
 
重启一下配置就好了。
 
好了,上面的服务器环境基本就配置完了。
 
我所写的都是一些基本的操作,至少可以让你的服务器工作正常工作。
 
如果你需要更高级的讲解
 
请参考我的其他关于技术方面的文章,也可以给我留言或者email我。
 
另外,推荐一个牛人的网站 车东,我的好多知识都是从这里学来的,包括下面的weblucene和awstats。
 
现在开始weblucene的配置:
 
第一步,获取weblucene:
 
cvs -z3 -d:pserver:anonymous@cvs.sourceforge.net:/cvsroot/weblucene co weblucene
 
这样一条cvs命令就好了。
 
命令执行成功后,你会得到一个weblucene的文件夹
 
将得到的weblucene文件夹移动到 /usr/local/resin/webapps 目录下
 
进入到weblucene里面
 
将你的 build.properties.default 改为 build.properties
 
编辑这个文件
 
修改jsdk_jar,javacc.home为你实际的文件和目录
 
我这里是:
 
jsdk_jar=/usr/local/resin/lib/jsdk23.jar
 
javacc.home = /usr/local/javacc2.1/bin
 
然后执行 ant build
 
如果出现错误,请仔细检查你上面的环境变量是否配置错误,比如java,classpath,javacc_home等
 
还有javacc的版本是否是2.1版本的。resin的版本是否是2.1.x的。
 
ok现在build成功了
 
仔细看看,会看到两个新的目录,一个是dump,另外一个就是webapp
 
dump是用来导出导入用的,webapp里面的内容就是搜索要用到的了。
 
先来看webapp
 
将里面的内容copy到你的站点目录上吧,
 
具体怎么建立resin的虚拟主机,上面已经提到了。
 
ok
 
配置好resin和weblucene后,重启你的web服务器
 
在你搜索的目录里面编辑一下index.jsp
 
内容为: 
 
然后用http方式访问,如果出现了5则表示环境配置成功了,如果没有出现,请回到以上配置resin的步骤仔细的检查,
 
如果出现的数值不是5,那么就找sun吧 :p
 
现在建立你测试用的索引文件
 
现在将dump目录copy到与你的站点同级的目录上。
 
进入dump目录,编辑你的index.sh
 
修改这4个地方的为你实际的路径
 
export JAVA_HOME=/usr/java/jdk
 
export ANT_HOME=/usr/java/ant
 
export LIB=/home/weblucene/webapp/WEB-INF/lib
 
export WEBLUCENE=../webapp/WEB-INF/var
 
运行index.sh文件。这个时候应该会是顺利的。
 
PS:在车东2005年1月7日cvs版本的weblucene中,index.sh中使用的是 -a选项增量的来增加索引。
 
如果你出现了如下错误,
 
1 [main] ERROR IndexRunner - java.io.IOException: Index locked for write: Lock@/html/domain/search/WEB-INF/var/all/index/write.lock
 
把索引清空来试试看
 
如果出现了如下的错误,
 
0 [main] ERROR IndexRunner - java.io.FileNotFoundException: /html/domain/search/WEB-INF/var/all/index/segments (No such file or directory)
 
把index.sh 里面最后一行 -a的选项清空来试试看。
 
现在用浏览器访问你的search.html页
 
search.your_domain.net/search.html
 
应该出现了吧,搜索下blog或者博客,如果没有问题,恭喜你,你可以接下来生成自己的数据了。
 
这里有一点,我用opera或者firefox浏览器浏览默认都是乱码,需要手工更改字符集编码,但是用ie就是正常的。
 
现在开始建立自己的索引xml文件吧。
 
这里只是说一下思路
 
首先从你的数据源(数据库,文件?都可以)取出记录
 
然后生成xml文件(可以使用PEAR里面的 SQL2XML的类,不过我没有使用)
 
记住xml文件的编码应该是gb2312的,
 
需要注意的是:生成的xml文件里面不能有特殊的字符,具体什么是特殊的字符,这个也困扰了我一天多的时间,后来写了一个php的函数解决了这个问题,
 
函数文件你可以点击这里来下载
 
这个函数解决了字符串的问题。
 
用这个函数过滤后,你可以得到英文,数字,简体繁体中文,日文,韩文没有测试,和一些qq里面的特殊符号。
 
另外,车东提供的escapeForXML和escapeForURL这两个函数也可以解决这个问题。
 
这两个函数在dump里面的include.php里面(惭愧,直到自己写了一个函数解决了问题才知道车东早已经写好了函数来解决了 ( ).
 
但是使用车东的这两个函数的前提是你编译php需要加载iconv模块,在上面编译php的时候已经加载了iconv模块。
 
如果使用车东的escapeForXML函数转换后产生了乱码,请把这行注释掉://$output = iconv(”UTF-8″, “UTF-8//IGNORE”, $output);
 
现在来定制自己的搜索吧
 
搜索的首页,也就是默认的search.html
 
这个就部管咯,自由发挥吧.
 
然后是定制自己的搜索
 
在默认的测试搜索中,你提交搜索后,会发现url参数中会有一个是dir=blog
 
对这个dir=blog就在你的search的网页目录下的WEB-INF/var/下面
 
也就是说你要建立自己不同的索引,就要在var/下面建立不同的目录
 
这里为了方便,直接copy blog这个目录,然后再进行修改。
 
不用担心以前测试的blog的索引会造成影响,使用全部重新生成索引会把以前建立的索引覆盖的。
 
请将WEB-INF/conf/目录下的log4j.conf.default重命名成 log4j.conf
 
然后你会在conf的目录下看到blog.conf,对这个就是每个应用的配置文件
 
对应着上面提到的每个dir=***
 
也是为了方便,copy blog.conf 为 *.conf
 
然后在进行修改,这里面每个应用的设置会覆盖默认的weblucene.conf的配置
 
等于说是继承与覆盖的关系吧。
 
你可以在wellucene.conf里面定义全局的配置,然后在每个应用的conf里面再定义特殊的配置,就是这里灵活。
 
ValidEncodings = gb2312, gbk, utf-8, unicode, iso-8859-1 #支持的编码
 
DefaultEncoding = utf-8 #默认的编码
 
ValidOrderStyles = docid, score #支持的排序方式
 
DefaultOrderStyle = docid #默认的排序方式
 
ValidOutputFormats = html, xml, rss #支持的输出格式
 
DefaultOutputFormat = html #默认输出的格式
 
#请注意字段的名称是区分大小写的。
 
#字段的名称必须与你建立索引的库是匹配的,也就是说在你索引的字段必须在你的生成的XML文件字段里面。
 
ValidIndexes = FullIndex, AuthorIndex #支持检索的字段的方式
 
DefaultIndex = FullIndex #默认检索的方式
 
#请注意字段的名称是区分大小写的。
 
#字段的名称必须与你建立索引的库是匹配的,也就是说在你索引的字段必须在你的生成的XML文件字段里面。
 
HighlightFields = Title,Author,Content #搜索关键字高亮显示的字段
 
#这个你一定要注意,这个是定义你xsl模板文件的位置的
 
#同样的,你多个应用也可以使用相同的xsl模板,这里也可以定义你自己的模板,只要符合规则
 
HtmlTemplate = WEB-INF/var/blog/html.xsl #html模板的位置
 
RssTemplate = WEB-INF/var/blog/rss.xsl #rss模板的位置
 
DirRealPath = WEB-INF/var/blog/index #索引目录的位置的位置
 
HighlightTag = b #要搜索的标签名称
 
SummaryLength = 128 #摘要长度
 
TotalResultLimit = 1000 #结果总数的限制
 
PerPageResultLimit = 100 #每页显示结果的数量
 
ExpiredMinutes = 180 #超时时间
 
请看你的var/目录下的一些xsl文件
 
这些都是全局的,然后你在你每个应用目录下的html.xsl里面的头部会看到包含这些文件的命令
 
也就是说,你也可以在你的应用目录下也建立相同名字的xsl文件,然后修改html.xsl就可以实现不同应用不同配置了。
 
为了安全着想,请编辑自己的WEB-INF/web.xml这个文件
 
把里面的
 
<servlet -mapping>
        </servlet><servlet -name>admin</servlet>
        <url -pattern>/admin</url>
 
用 <!-- -->
注释掉,因为一般不使用这个管理功能,
注意:
<servlet>
        </servlet><servlet -name>admin</servlet>
        <servlet -class>com.chedong.weblucene.WebLuceneAdminServlet</servlet>
        <init -param>
          <param -name>log4j.conf</param>
          <param -value>WEB-INF/conf/log4j.conf</param>
        </init>
        <init -param>
          <param -name>properties.path</param>
          <param -value>WEB-INF/conf</param>
        </init>
        <load -on-startup>1</load>
这部分请保留,因为里面有log4j的配置,如果把这部分也注释掉,会不能搜索的.
 
管理功能最主要的:Reload Configurations(重新加载配置)
 
这个功能会重新加载你的配置和xslt模板,正式服务上线后,关掉admin吧。
 
如果你要使用安全的管理功能
 
可以参考车东weblucene里面的BUILD.txt的
 
部署Web应用
 
=============
 
以下是一个包含了认证设置的resin配置:
 
<web -app id='/weblucene' app-dir='/home/weblucene/webapp' class-update-interval='120'>
       <login -config auth-method='basic'>
          <authenticator>
            <class -name>com.caucho.http.security.XmlAuthenticator</class>
            <init -param user='username:password:rolename'/>
          </authenticator>
        </login>
        <security -constraint url-pattern='/admin' role-name='rolename'/>
    </web>

这部分的配置,然后自己做相应的修改。

在这里面遇到最多的问题就是编码和xsl的问题,编码存在于配置文件里面

我生成xml的文件编码是gb2312,然后conf文件的编码指定的是utf-8

另外,如果你的页面显示为空白页,请仔细检查你的xsl文件,错误大多存在于你不合法的xsl文件中。

经过测试,感觉按照相关度排序比按照时间排序的效果好,

所以我在conf文件中把默认的排序方式修改为了 score.

ok,welcene简短的就介绍到这里了,是不是已经有了属于自己的站内搜索了呢?

下面来介绍一下awstats,一个用perl写的开源的网站统计程序.

发表评论

电子邮件地址不会被公开。 必填项已用*标注