按照行数、分割的文件数分别分割txt文件的方法

2801次阅读 174人点赞 作者: WuBin 发布时间: 2021-10-29 09:01:51
扫码到手机查看

按照行数对txt文件进行分割

/*
分割TXT文件 通过行分割文件
$file_name 文件名
$number_lines 分割成多少个文件
 */
function split_file_by_lines($file_name, $number_lines)
{
    try
    {
        if(!file_exists($file_name)) {
            throw new Exception("文件不存在!");
        }

        // 分割文件名和后缀
        $filename = explode('.', $file_name)[0];

        // 将一个数组分割成多个
        $contents_array = array_chunk(file($file_name), $number_lines);

        if(!$contents_array || !is_array($contents_array)) {
            throw new Exception("文件内容不合法!");
        }
 
        array_walk($contents_array, function($contents, $k, $filename){
            foreach($contents as $value){
                file_put_contents("{$filename}-{$k}.txt", $value, FILE_APPEND);
            } 
        }, $filename);
    }
    catch(Exception $e)
    {
        echo $e->getMessage();    
    }
}
// 每500行生成一个txt文件
split_file_by_lines("敏感词.txt", 500);

按要求生成的文件数分割

/*
通过分割的文件数分割文件
$file_name 文件名
$filecount 文件数
 */
function split_file_by_file($file_name, $file_count)
{
    try
    {
        if(!file_exists($file_name)) {
            throw new Exception("文件不存在!");
        }

        $arr = file($file_name);
        $arrLen = count($arr);

        // 分割文件名和后缀
        $file_name = explode('.', $file_name)[0];

        // 每个数组中含有多少项
        $number_lines = floor($arrLen / $file_count) + ($arrLen % $file_count);

        // 将一个数组分割成多个
        $contents_array = array_chunk($arr, $number_lines);

        if(!$contents_array || !is_array($contents_array)) {
            throw new Exception("文件内容不合法!");
        }

        array_walk($contents_array, function($contents, $k, $file_name){
            foreach($contents as $value){
                // 去掉左右的空格 再写入
                $val = trim($value);
                file_put_contents("{$file_name}-{$k}.txt", $val, FILE_APPEND);
            } 
        }, $file_name);
    }
    catch(Exception $e)
    {
        echo $e->getMessage();    
    }
}
// 将txt文件分割为3个txt文件
split_file_by_file("敏感词.txt", 3);

两个函数的解析

array_chunk

array_chunk() 函数把一个数组分割为新的数组块。

array_chunk(array,size,preserve_keys);
参数描述
array必需。规定要使用的数组。
size必需。一个整数,规定每个新数组块包含多少个元素。在此处就是新文件中包含的行数。
preserve_key
可选。可能的值:
  • true - 保留原始数组中的键名。
  • false - 默认。每个新数组块使用从零开始的索引。

array_walk

array_walk() 函数对数组中的每个元素应用用户自定义函数。在函数中,数组的键名和键值是参数。

注意,这个函数使用的时候,是有作用域的。

$a = 'a';
array_walk($arr, function($arrItem, $key, $a, $多个参数...) {
 ... // 这里无法直接访问$a,必须将$a传入 并在函数中接收
}, $a, $多个参数...)

点赞 支持一下 觉得不错?客官您就稍微鼓励一下吧!
关键词:array-walk,array-chunk
推荐阅读
  • uniapp实现被浏览器唤起的功能

    当用户打开h5链接时候,点击打开app若用户在已经安装过app的情况下直接打开app,若未安装过跳到应用市场下载安装这个功能在实现上主要分为两种场景,从普通浏览器唤醒以及从微信唤醒。

    9603次阅读 623人点赞 发布时间: 2022-12-14 16:34:53 立即查看
  • Vue

    盘点Vue2和Vue3的10种组件通信方式

    Vue中组件通信方式有很多,其中Vue2和Vue3实现起来也会有很多差异;本文将通过选项式API组合式API以及setup三种不同实现方式全面介绍Vue2和Vue3的组件通信方式。

    4297次阅读 317人点赞 发布时间: 2022-08-19 09:40:16 立即查看
  • JS

    几个高级前端常用的API

    推荐4个前端开发中常用的高端API,分别是MutationObserver、IntersectionObserver、getComputedstyle、getBoundingClientRect、requ...

    14452次阅读 948人点赞 发布时间: 2021-11-11 09:39:54 立即查看
  • PHP

    【正则】一些常用的正则表达式总结

    在日常开发中,正则表达式是非常有用的,正则表达式在每个语言中都是可以使用的,他就跟JSON一样,是通用的。了解一些常用的正则表达式,能大大提高你的工作效率。

    13497次阅读 491人点赞 发布时间: 2021-10-09 15:58:58 立即查看
  • 【中文】免费可商用字体下载与考证

    65款免费、可商用、无任何限制中文字体打包下载,这些字体都是经过长期验证,经得住市场考验的,让您规避被无良厂商起诉的风险。

    12015次阅读 963人点赞 发布时间: 2021-07-05 15:28:45 立即查看
  • Vue

    Vue3开发一个v-loading的自定义指令

    在vue3中实现一个自定义的指令,有助于我们简化开发,简化复用,通过一个指令的调用即可实现一些可高度复用的交互。

    16376次阅读 1307人点赞 发布时间: 2021-07-02 15:58:35 立即查看
  • JS

    关于手机上滚动穿透问题的解决

    当页面出现浮层的时候,滑动浮层的内容,正常情况下预期应该是浮层下边的内容不会滚动;然而事实并非如此。在PC上使用css即可解决,但是在手机端,情况就变的比较复杂,就需要禁止触摸事件才可以。

    15187次阅读 1234人点赞 发布时间: 2021-05-31 09:25:50 立即查看
  • Vue

    Vue+html2canvas截图空白的问题

    在使用vue做信网单页专题时,有海报生成的功能,这里推荐2个插件:一个是html2canvas,构造好DOM然后转canvas进行截图;另外使用vue-canvas-poster(这个截止到2021年3月...

    29849次阅读 2347人点赞 发布时间: 2021-03-02 09:04:51 立即查看
  • Vue

    vue-router4过度动画无效解决方案

    在初次使用vue3+vue-router4时候,先后遇到了过度动画transition进入和退出分别无效的情况,搜遍百度没没找到合适解决方法,包括vue-route4有一些API都进行了变化,以前的一些操...

    25909次阅读 1994人点赞 发布时间: 2021-02-23 13:37:20 立即查看
交流 收藏 目录