LeetCode 393. UTF-8 编码验证（位运算）数据结构与算法Michael是个半路程序员-

19 五月

星期二, 19 五月 2020 08:28 Last Updated on 星期二, 19 五月 2020 08:28 0 Comments

1. 题目

UTF-8 中的一个字符可能的长度为 1 到 4 字节，遵循以下的规则：

对于 1 字节的字符，字节的第一位设为0，后面7位为这个符号的unicode码。
对于 n 字节的字符 (n > 1)，第一个字节的前 n 位都设为1，第 n+1 位设为0，后面字节的前两位一律设为10。剩下的没有提及的二进制位，全部为这个符号的unicode码。
这是 UTF-8 编码的工作方式：

   Char. number range |        UTF-8 octet sequence       (hexadecimal) | (binary) --------------------+--------------------------------------------- 0000 0000-0000 007F | 0xxxxxxx    0000 0080-0000 07FF | 110xxxxx 10xxxxxx    0000 0800-0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx    0001 0000-0010 FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx 给定一个表示数据的整数数组，返回它是否为有效的 utf-8 编码。  注意: 输入是整数数组。只有每个整数的最低 8 个有效位用来存储数据。 这意味着每个整数只表示 1 字节的数据。  示例 1: data = [197, 130, 1], 表示 8 位的序列: 11000101 10000010 00000001. 返回 true 。 这是有效的 utf-8 编码，为一个2字节字符，跟着一个1字节字符。  示例 2: data = [235, 140, 4], 表示 8 位的序列: 11101011 10001100 00000100. 返回 false 。 前 3 位都是 1 ，第 4 位为 0 表示它是一个3字节字符。 下一个字节是开头为 10 的延续字节，这是正确的。 但第二个延续字节不以 10 开头，所以是不符合规则的。

来源：力扣（LeetCode）链接：https://leetcode-cn.com/problems/utf-8-validation
著作权归领扣网络所有。商业转载请联系官方授权，非商业转载请注明出处。

2. 解题

前面1的个数不能为1或者大于4
为0的跳过，检查下一个
为2-4，检查后面个数足不足，且都以10开头

class Solution { public: bool validUtf8(vector<int>& data) { int i = 0, j, one = 0, n = data.size(); while(i < n) { for(j = 7; j >= 0; --j) { if((data[i]&(1<<j)))//该位为1         one++;//1的个数 else break; } if(one==1 || one > 4) return false;       i++; if(one == 0) continue;//0个1，检查下一位 if(n-i < one-1) return false;//个数不够，不行 for( ; i < n && (--one); ++i)//后面均以10开头 { if(((data[i]>>7)&1)!=1 || ((data[i]>>6)&1)!=0) return false; } } return true; } };

28 ms 13.4 MB

Michael阿明

LeetCode 393. UTF-8 编码验证（位运算）数据结构与算法Michael是个半路程序员-

原创文章 1078获赞 4740访问量 63万+

关注他的留言板

展开阅读全文

6
评论 2
x
海报

扫一扫，海报
手机看

到微信朋友圈

x

扫一扫，手机阅读
打赏

打赏

Michael阿明

“如果可以，请留言支持我哦！”

5C币 10C币 20C币 50C币 100C币 200C币

确定

gsch_12的博客

09-12 LeetCode 393. UTF-8 编码验证（位运算）数据结构与算法Michael是个半路程序员- 935

头条2019笔试题 4：leetcode393:utf-8编码验证

题目：给定一个整数数组，判断是不是utf-8编码 ps:整数只有最低8位来存数据。输入的每个整数都代表一个byte‘ 输入第一行一个整数表示数组长度N’ 第二行空格隔开N整数输出 1合法 0非法…

本页所有内容来自官方网站 https://www.imapbox.com 新闻来源：互联网搜索引擎和新闻站

本网页所有图片由 ImageBox 图片批量下载器,网页图片批量下载专家,网页图片批量下载器,获取到文章图片，下载并得到。

ImageBox 图片批量下载器工具地址: 网页图片批量下载工具-最新版本下载

非凡下载站地址：https://www.crsky.com/soft/35838.html

本网页所有视频内容由 imoviebox边看边下-网页视频下载, iurlBox网页地址收藏管理器下载并得到。

ImovieBox网页视频下载器下载地址: ImovieBox网页视频下载器-最新版本下载

本文章由: imapbox邮箱云存储,邮箱网盘,ImageBox 图片批量下载器,网页图片批量下载专家,网页图片批量下载器,获取到文章图片,imoviebox网页视频批量下载器,下载视频内容,为您提供.

阅读和此文章类似的: 全球云计算

LeetCode 393. UTF-8 编码验证（位运算）数据结构与算法Michael是个半路程序员-

1. 题目

2. 解题

头条2019笔试题 4：leetcode393:utf-8编码验证

文章目录

近期文章

官方链接

关于我们

软件产品

事业方向

联系我们

ImapBox Technology Research Group

LeetCode 393. UTF-8 编码验证（位运算）数据结构与算法Michael是个半路程序员-

1. 题目

2. 解题

头条2019笔试题 4：leetcode393:utf-8编码验证

文章目录

近期文章

官方链接

关于我们

软件产品

事业方向

联系我们

ImapBox Technology Research Group

登录