贪玩的程序员

博文

目前显示的是一月, 2010的博文

眼不见为净——过滤人人网分享的chrome扩展

眼不见为净——过滤人人网分享的chrome扩展 redraiment, 2010-01-31 人人网的分享标题　　进人人网（校内网）就免不了分享一些在线视频、音乐……有些同学进校内也纯粹是为了看分享，呵呵。分享原本是不错的东西，可以让新鲜事迅速传播。但最近有部分人，在分享链接时，在标题上赫然写着“看见不分享就倒霉一年”、“不分享的考试挂科”等诅咒信息，强奸我们的眼睛，唯恐天下不乱！　　以前，在人人网中分享好友的“分享”时可以自己修改标题，所以我看到此类信息时都会手工去除恶意信息。但最近人人进行了升级，分享好友的“分享”时只能添加评论，不能修改标题。询问周围的同学，也有不少人对此类标题深恶痛绝！我要过滤　　本来这无可厚非，人家写这样的标题或许他/她们真觉得这个视频、音乐很不错，迫切地希望大家都能看/听到。但每个人的喜恶不同，这样的做法有点类似看电影时旁边一个同学向你絮絮叨叨后面的情景——好心办坏事。我还是希望每个人能比较客观地发表自己的意见，因此我不希望这些标题出现在我的首页上。　　一开始，我还是打算像往常一样写个客户端程序，每次在进人人网之前先执行一下，把带此类标题的新鲜事标记为已读。但以我这样的马大哈还真不能保证每次记得执行；另外，我从人人网上下载的Java Client开发包，但找来找去也没找到个像样的文档。所以就放弃客户端的想法。　　转念一想“如果浏览器本身提供这样的功能就好了”，再一想就想到开发浏览器的扩展/插件。我习惯用Chrome，最新版的也支持扩展开发了，而且在线文档也比较完整： http://code.google.com/chrome/extensions/index.html 。 Chrome扩展　　我已经将扩展发布，如果你也有被相类似的问题困扰，并且也使用最新的 Chrome 浏览器，欢迎到项目主页 https://chrome.google.com/extensions/detail/kajehjgpeliapeaileldhcabdalkeflo 下载安装。　　安装完后，当打开人人网时扩展就会启动，并在地址栏里显示图标：　　在页面加载完后，扩展就会自动检查你的“新鲜事列表”，把所有带“不分享”的文字统统替换掉，下图是我和同学做的一个测试：　　想关闭过滤功能，只要将它禁用即可。这个程序很小很简单，我会在下一篇文章中...

阅读全文

Linux下用nc实现DuplexPipe

Linux下用nc实现DuplexPipe redraiment, 2010-01-25 　　nc 是一把网络的瑞士军刀，我以前在介绍 DuplexPipe 时也提到过，如果你没接触过它，可以先参看一下《 DuplexPipe二三事（二）》。再来简单地介绍一下 DuplexPipe，顾名思义，它是一个“双向管道”。在 shell 中，我们通过“|”使用匿名管道，让前一条命令的输出作为后一条命令的输入；双向管道即在此基础上在加上“后一条命令的输入作为前一条命令的输入”。这是最初开发它的原因，但后来发现它更像是一个网络接口转换器，“DuplexPipe”这个名字反而不能体现它的功能。更多内容请参看 DuplexPipe系列文章。留言　　今天网友黄海给我留言，他通过用 nc 的 -e 选项来执行 nc 本身来实现 DuplexPipe。留言原文如下：哥们，你写的那个DuplexPipe, 我很欣赏。不过近日于网上逛发现此工具的功能竟然完全可以用netcat做到，有两种方法，我的博客上载了一种。简单描述如下：在windows下： echo nc [ip] [port] > relay.bat nc -l -p [port2] -e relay.bat 其余的类推第二种方法是用命名管道：(linux下) mknod backpipe p nc -l -p [port] 0<backpipe | nc [ip] [port12] | tee backpipe 　　其中选项 -e 的作用是： for NT: -e prog inbound program to exec [dangerous!!] for Linux: -e filename program to exec after connect [dangerous!!] Windows下不行　　在我开发 DuplexPipe 时确实考虑过功能会不会和 nc 重叠，当时只想着通过 shell 管道来连接，忘了 nc 自带了一个双向管道！我首先在 Vista 下做了测试，nc(win32) 是从 http://www.securityfocus.com/tools/139 ...

阅读全文

用awk去除C语言注释

用awk去除C语言注释 redraiment, 2010-01-06 　　今天闲逛 Linux宝库，看到论坛里有人在讨论如何用 shell 脚本来处理 C 语言注释，发帖时间是 08-10-23（以前怎么都没注意到，失败...），但问题好像并没被解决。正好这两天玩 sed & awk，来小试一下身手。 C语句注释　　本文讨论的是 C99 标准，它支持单行注释（“// ...”）和块注释（“/*...*/”），并且当单行注释以“\”结尾时也可以跨多行。测试代码如下： #include <stdlib.h> #include <stdio.h> int main (int argc, char *argv[]) { // not show\ not show\ not show // not show /* not show */ int is; // not show int /* not show */ ms; /* not show */ double ds; // not show\ not show\ not show double dm; /* ... not show not show */ float fs; /** * now show */ float /**/ fm; char cs[] = "aaa // /***/"; ...

阅读全文

awk学习笔记

awk学习笔记 redraiment, 2010-01-05 看完sed部分之后　　花了几个晚上看完后面 awk 部分。awk 不同于 sed，它是一门模式匹配的程序设计语言。学习 sed 和 awk 时，正则表达式可能是一大障碍。但事有凑巧，去年我暑假我一个人出去散心时，顺带看完了《精通正则表达式（第三版）》，另外我还掌握一些 Bash、Perl 等脚步编程的经验，因此很快就能适应 awk 的风格。　　写到此处，我突然联系到《倚天屠龙记》中的张无忌，他经常说“我有九阳神功护体，学什么武功都很快”；那我们程序员也可以牛气地喊“我掌握了正则表达式，UNIX下工具上手都很快”，哈哈。环境的问题　　比起 sed，使用 awk 时让我有点小意外，哈哈。　　一、Debian 5.0 默认安装的 awk 是 mawk 。我一开始以为是 GNU awk，直到测试“gensub”函数（gawk特有）时才发现不对，于是通过 CD 盘安装了 GNU awk。到目前为止，gawk 的最新版本是 3.1.7，但 Debian 5.0 的软件包中提供的是 v3.1.5 。而 fedora 默认安装的是 gawk v3.1.5，另外我在 Windows 下也使用 gawk.exe v3.1.5。　　二、在上文《 sed单行脚本学习笔记》中已经提到用模式“[ -~]”来匹配任意可打印字符，这个特性在 mawk 中也可使用。理论上在 GNU gawk 中不能使用，但在 Windows 平台下的 gawk 却也具备此特性。为保持脚本的可移植性，应该用“[:print:]”来代替。　　三、gawk 支持扩展的正则表达式，在文档中指出操作符“\B”可以匹配单词中字符与字符之间的空白位置。例如模式“/\Bour/”可以匹配“course”，不能匹配“our”。但这一特性在 gawk v3.1.5 中实现有问题。 $ cat data ABCDE ABCD ABC AB A $ awk --version | head -1 GNU Awk 3.1.5 $ awk '{gsub(/\B/,"-")}1' data A-B-C-DE A-B-CD A-BC A-B A 　　如上所示，当单词长度大于二，在 gsub 中“\B”...

阅读全文