Re: [Qemu-devel] [PATCH 37/56] json: Treat unwanted interpolation as lex

qemu-devel

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [Qemu-devel] [PATCH 37/56] json: Treat unwanted interpolation as lex

From:	Markus Armbruster
Subject:	Re: [Qemu-devel] [PATCH 37/56] json: Treat unwanted interpolation as lexical error
Date:	Tue, 14 Aug 2018 08:51:46 +0200
User-agent:	Gnus/5.13 (Gnus v5.13) Emacs/26.1 (gnu/linux)

Eric Blake <address@hidden> writes:

> On 08/08/2018 07:03 AM, Markus Armbruster wrote:
>> The JSON parser optionally supports interpolation.  The lexer
>> recognizes interpolation tokens unconditionally.  The parser rejects
>> them when interpolation is disabled, in parse_interpolation().
>> However, it neglects to set an error then, which can make
>> json_parser_parse() fail without setting an error.
>>
>> Move the check for unwanted interpolation from the parser's
>> parse_interpolation() into the lexer's finite state machine.  When
>> interpolation is disabled, '%' is now handled like any other
>> unexpected character.
>>
>> The next commit will improve how such lexical errors are handled.
>>
>> Signed-off-by: Markus Armbruster <address@hidden>
>> ---
>>   include/qapi/qmp/json-lexer.h |  4 ++--
>>   qobject/json-lexer.c          | 42 ++++++++++++++++++++++++++---------
>>   qobject/json-parser.c         |  4 ----
>>   qobject/json-streamer.c       |  2 +-
>>   tests/qmp-test.c              |  4 ++++
>>   5 files changed, 39 insertions(+), 17 deletions(-)
>>
>
>
>> @@ -271,17 +272,38 @@ static const uint8_t json_lexer[][256] =  {
>>           [','] = JSON_COMMA,
>>           [':'] = JSON_COLON,
>>           ['a' ... 'z'] = IN_KEYWORD,
>> +        [' '] = IN_WHITESPACE,
>> +        ['\t'] = IN_WHITESPACE,
>> +        ['\r'] = IN_WHITESPACE,
>> +        ['\n'] = IN_WHITESPACE,
>> +    },
>> +
>> +    [IN_START_INTERPOL] = {
>> +        ['"'] = IN_DQ_STRING,
> ...
>
>> +        ['\n'] = IN_WHITESPACE,
>> +        /* matches IN_START up to here */
>>           ['%'] = IN_INTERPOL,
>
> You could compress this as:
>
> [IN_START_INTERPOL ... IN_START] = {
>    ['"'] = ...
>    ['\n'] = ...
> },
> [IN_START_INTERPOL]['%'] = IN_INTERPOL,
>
> rather than duplicating the common list twice. (We already exploit
> gcc's range initialization, and the fact that you can initialize a
> broader range and then re-initialize a more specific subset later)

Neat!

It'll lose some of its charm in PATCH 52, but enough remains for me to
like it.

>> +++ b/tests/qmp-test.c
>> @@ -94,6 +94,10 @@ static void test_malformed(QTestState *qts)
>>         /* lexical error: interpolation */
>>       qtest_qmp_send_raw(qts, "%%p\n");
>> +    /* two errors, one for "%", one for "p" */
>> +    resp = qtest_qmp_receive(qts);
>> +    g_assert_cmpstr(get_error_class(resp), ==, "GenericError");
>> +    qobject_unref(resp);
>>       resp = qtest_qmp_receive(qts);
>>       g_assert_cmpstr(get_error_class(resp), ==, "GenericError");
>>       qobject_unref(resp);
>
> I'm impressed at how easily you got the lexer to parse two different
> token grammars, and agree that doing it in the lexer when we don't
> want interpolation is a nicer place.
>
> Reviewed-by: Eric Blake <address@hidden>

Well, what you see here isn't my first attempt to make the lexer do it,
it's the one I finally liked :)

Thanks!

[Prev in Thread]

Current Thread

[Next in Thread]

[Qemu-devel] [PATCH 29/56] check-qjson: Fix and enable utf8_string()'s disabled part, (continued)
- [Qemu-devel] [PATCH 29/56] check-qjson: Fix and enable utf8_string()'s disabled part, Markus Armbruster, 2018/08/08
  - Re: [Qemu-devel] [PATCH 29/56] check-qjson: Fix and enable utf8_string()'s disabled part, Eric Blake, 2018/08/10
- [Qemu-devel] [PATCH 21/56] json: Reject invalid UTF-8 sequences, Markus Armbruster, 2018/08/08
  - Re: [Qemu-devel] [PATCH 21/56] json: Reject invalid UTF-8 sequences, Eric Blake, 2018/08/09
    - Re: [Qemu-devel] [PATCH 21/56] json: Reject invalid UTF-8 sequences, Markus Armbruster, 2018/08/10
    - Re: [Qemu-devel] [PATCH 21/56] json: Reject invalid UTF-8 sequences, Eric Blake, 2018/08/10
- [Qemu-devel] [PATCH 38/56] json: Pass lexical errors and limit violations to callback, Markus Armbruster, 2018/08/08
  - Re: [Qemu-devel] [PATCH 38/56] json: Pass lexical errors and limit violations to callback, Eric Blake, 2018/08/13
- [Qemu-devel] [PATCH 37/56] json: Treat unwanted interpolation as lexical error, Markus Armbruster, 2018/08/08
  - Re: [Qemu-devel] [PATCH 37/56] json: Treat unwanted interpolation as lexical error, Eric Blake, 2018/08/13
    - Re: [Qemu-devel] [PATCH 37/56] json: Treat unwanted interpolation as lexical error, Markus Armbruster <=
- [Qemu-devel] [PATCH 42/56] json: Improve names of lexer states related to numbers, Markus Armbruster, 2018/08/08
  - Re: [Qemu-devel] [PATCH 42/56] json: Improve names of lexer states related to numbers, Eric Blake, 2018/08/13
- [Qemu-devel] [PATCH 50/56] json: Unbox tokens queue in JSONMessageParser, Markus Armbruster, 2018/08/08
  - Re: [Qemu-devel] [PATCH 50/56] json: Unbox tokens queue in JSONMessageParser, Eric Blake, 2018/08/16
- [Qemu-devel] [PATCH 19/56] json: Tighten and simplify qstring_from_escaped_str()'s loop, Markus Armbruster, 2018/08/08
  - Re: [Qemu-devel] [PATCH 19/56] json: Tighten and simplify qstring_from_escaped_str()'s loop, Eric Blake, 2018/08/09
- [Qemu-devel] [PATCH 36/56] json: Rename token JSON_ESCAPE & friends to JSON_INTERPOL, Markus Armbruster, 2018/08/08
  - Re: [Qemu-devel] [PATCH 36/56] json: Rename token JSON_ESCAPE & friends to JSON_INTERPOL, Eric Blake, 2018/08/13
    - Re: [Qemu-devel] [PATCH 36/56] json: Rename token JSON_ESCAPE & friends to JSON_INTERPOL, Markus Armbruster, 2018/08/14
- [Qemu-devel] [PATCH 32/56] json: Have lexer call streamer directly, Markus Armbruster, 2018/08/08

Prev by Date: Re: [Qemu-devel] [PATCH v2] nvme: correct locking around completion
Next by Date: Re: [Qemu-devel] [Qemu-block] [PATCH v0 0/2] Postponed actions
Previous by thread: Re: [Qemu-devel] [PATCH 37/56] json: Treat unwanted interpolation as lexical error
Next by thread: [Qemu-devel] [PATCH 42/56] json: Improve names of lexer states related to numbers
Index(es):
- Date
- Thread