Posted on 2008/03/25, 14:54, by Amom, under
随手乱弹.
今天Google Reader阅读的时候,看到DBA Notes说起阿里的第二届侠客行技术大会要 在5.10举办了,就跑过去看了看。像这样的技术大会在国外有很多,国内现在也挺多,但基本上都是微软、Intel、Oracle等等之类的国外技术公司 在中国的分场活动,中国公司中鲜有举办此类大会的。内心里很希望有那么几家中国公司能够举办一些够份量的(务实的技术讨论、分享、前瞻)技术大会,但是看 看目前这些大的网络公司,百度、腾讯、阿里、新浪,要么是没有很强的技术积累,要么是很封闭的环境,没有一点开放的心态来吸引技术人员。
事实上从上一次阿里举办侠客行大会,我有种怪的感觉,因为阿里从来没有给人技术很强的感觉(现在不同了,关注了淘宝、支付宝的DBA团队,感觉不 错!)。当时只是以为阿里把一些雅虎本部的大牛们请来宣讲宣讲,仅仅是是马云收购雅虎的一种技术方面的策略,不会有什么第二届之类的。不过不管感觉如何, 有一个大公司来搞这个技术大会,对于国内的技术环境来说,终归是一种好事。当这种氛围浓厚的时候,或许我们也会有基础性的网络技术创新,也会有大师级的技 术人才出现。
Posted on 2008/03/16, 12:48, by Amom, under
技术网志.
1 这周最后两天开始翻去年买的那两本数据挖掘的书。去年随便看过一些,但是一直没有认真的去学习,对于数据仓库、数据集市、OLAP、数据立方体等等的概念 都比较模糊。现在是该深入的时候了。简单说说数据仓库的概念,相对于我们通常的应用数据库(比如说网站后端的数据库),数据仓库是稳定的、面向主题的,没 有事务、恢复和并发处理。通俗一点说就是数据仓库中的数据是按照数据分析、挖掘的需求重新组织后不断的累计起来的。再来说数据集市,它是数据仓库的一部 分,比如某个集团公司中一个分公司的数据。但是注意这样说的前提是先建立了数据仓库,然后区分分公司或部门的数据以满足各自的分析需求。
而OLAP和数据立方体(Data Cube)这两个概念是进行数据分析中碰到的,OLAP(联机分析处理)是数据分析的手段,数据立方体则是OLAP进行分析的数据单元。数据立方体是需要 通过分析需求后(确定分析的维度、度量值等等)在数据仓库中建立的。在这个过程中我认为比较重要的两点是,数据的粒度和分析性能。
先简单说这么多,接下来的一段时间会继续学习和应用这方面的知识,我会继续写这方面的东西。