handle_starttag每遇见一个以"<"开始的tag回调一次,handle_endtag每遇见一个""标识的结束时回调一次,你的text3和text5位于结束标记之后,因此要自己手动用flag标记下,然后在handle_data里处理对应的数据!
好用的爬虫还是用 618IP 家的。